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用 号 


A language that doesn’t affect the way you think about programming 
is not worth knowing. 


Alan Perlis 


Rust 简 介 


Rust 是 一 门 新 的 编程 语言 。 


我 想 ， 大 部 分 读者 看 到 本 书 ， 佑 计 都 会 不 约 而 同 地 想到 同样 的 问 
题 : 现存 的 编程 语言 已 经 多 得 数 不 清 了 ， 再 发 明 一 种 新 的 编程 语言 有 
何 意义 ? 难道 现存 的 那么 多 编程 语言 还 不 够 用 吗 ， 发 明 一 种 新 的 编程 
语言 能 解决 什么 新 问题 ? 


俗话 说 ， 工 欲 普 其 事 ， 必 先 利 其 砷 。 在 程序 员 平 时 最 常用 的 工具 
排行 榜 中 ， 编 程 语 言 当仁不让 的 是 最 重要 的 “大 ”。 编 程 语言 不 仅 是 给 
程序 设计 者 使 用 的 工具 ， 反 过 来 ， 它 也 深刻 地 影响 了 设计 者 本 号 的 思 
维 方式 和 开发 习惯 。 


卓越 的 编程 语言 ， 可 以 将 优秀 的 设计 、 先 进 的 思想 、 成 功 的 经 
2 使 更 多 的 使 用 者 开阔 眼界 、 拓 展 思路 ， 受 
益 无 穷 。 


A programming language is a tool that has profound influence on our 
thinking habits. 


——Edsger Dijkstra 
所 以 说 天 于 这 个 问题 ， 我 认为 ， 如 采 与 现 有 的 各 种 语言 相 比 ， 新 
设计 的 语言 有 所 进步 、 有 所 发 展 、 有 所 创 狐 ， 那 么 它 的 出 现 束 很 有 意 
义 。 


最 近 这 些 年 ， 的 确 涌现 出 了 一 大 批 编 程 语言 ， 可 以 说 是 百 化 和 争 
艳 、 楷 华 似 锅 。 但 是 在 表面 的 索 采 之 下 ， 我 们 是 否 可 以 目 满 地 说 ， 编 


程 语言 的 设计 和 发 展 已 经 基本 成 熟 、 趋 于 完美 了 呢 ? 念 怕 不 尽 然 吧 


那些 优秀 的 编程 语言 中 ， 不 少 都 有 目 己 的 “绝活 *”。 有 的 性 能 非常 
高 ， 有 的 表达 力 非 常 强 ， 有 的 擅长 组 织 大 型 程序 ， 有 的 适合 小 巧 的 脚 
本 ， 有 的 专注 于 并 发 ， 有 的 偏重 于 科学 计算 ， 等 等 ， 不 一 而 足 。 即 便 
如 此 ， 新 兴 的 Rust 语 言 面市 后 依旧 展现 出 了 它 的 独特 魅力 ， 矫 矫 不 
群 ， 非 常 值得 大 家 关注 。 


作为 多 年 来 鲜 有 的 新 一 代 系 统 编程 语言 ， 它 的 设计 准则 是 “安全 ， 
并 发 ， 实 用 ”。Rnust 的 设计 者 是 这 样 定 位 这 门 语 言 的 : 


Rust is a System's programming language that runs blazingly fast, 
prevents segfaults, and guarantees thread safety. 


安全 


征 的 ， 安 全 性 很 重要 。Rnust 最 重要 的 特点 束 是 可 以 提供 内 存 安全 
保证 ， 而 且 没 有 额外 的 性 能 损失 。 


在 传统 的 系统 级 编程 语言 (C/C++) 的 开发 过 程 中 ， 经 常 出 现 因 
各 种 内 存 错误 引起 的 朋 溃 或 bpug。 比 如 空 指针 、 野 指针 、 内 存 洱 漏 、 内 
存 越界 、 段 错误 、 数 据 竞 争 、 迭 代 大 失效 等 ， 血 泪 斑 班 ， 数 不 胜 数 。 
这 些 问 题 不 仅 在 教科 书 中 被 无 数 次 提起 ， 而 且 在 实践 中 也 极其 常见。 
因此 ， 各 种 高 手 辫 藻 地 总 结 了 大 量 的 编程 经 验 ， 许 多 代码 检查 和 调试 
工具 被 开发 出 来 ， 各 种 代码 开发 流程 和 规范 被 制定 出 来 ， 无 数 人 哎 心 
沥 血 就 是 为 了 系统 性 地 防止 各 类 bug 的 出 现 。 尽 管 如 此 ， 我 们 依然 无 法 
彻底 解决 这 些 问题 。 


教科 书 解 决 不 了 问题 ， 因 为 教育 不 是 强制 性 的 ， 静 态 代 码 检查 工 
具 解 决 不 了 问题 ， 因 为 传统 的 C/C++ 对 静态 代码 检查 不 友好 ， 永 远 只 
能 查 出 一 部 分 问题 ， 软 件 工程 解决 不 了 问题 ， 因 为 规范 依赖 于 执行 者 
的 厅 奈 ， 任 何人 都 会 犯错 误 。 事 后 debug 也 不 是 办 法 ， 人 解决 bug 的 代价 


更 高 


鉴于 手动 内 存 管 理 非 常 容易 出 问题 ， 因 此 移 曹 们 发 明了 一 种 目 动 
垃圾 回收 的 机 制 (Garbage Collection) ， 故 而 程序 员 在 绝 大 多 数 情 况 
下 不 用 再 操心 内 存 释 放 的 问题 。 新 发 明 的 绝 大 多 数 编程 语言 都 使 用 了 
基于 各 种 高 级 算法 的 自动 垃圾 回收 机 制 ， 因 为 它 确实 方便 ， 解 放 了 程 


序 员 的 大 脑 ， 使 大 家 能 更 专注 于 业务 逻辑 的 部 分 。 但 是 到 目前 为 止 ， 
不 管 使 用 哪 种 算法 的 GC 系 统 ， 在 性 能 上 都 要 付出 比较 大 的 代价 。 要 人 么 
需要 较 大 的 运行 时 占用 较 大 内 存 ， 要 么 需要 暂停 整个 程序 ， 要 么 具备 
不 确定 性 的 时 延 。 当 然 ， 在 现实 的 许多 业务 场景 中 ， 这 点 开销 是 微 不 
足 道 的 ， 因 此 问题 不 大 。 可 是 如 采 在 性 能 敏感 的 领域 ， 这 是 完全 不 可 


接受 的 。 


很 遗憾 ， 到 目前 为 止 ， 在 系统 级 编程 语言 中 ， 我 们 依然 被 各 种 内 
存 安全 问题 所 困扰 。 这 些 年 来 ， 许 多 新 的 语言 特性 被 发 明 出 来 ， 许 多 
优秀 的 编程 范式 被 总 结 出 来 ， 许 多 高 质量 的 代码 库 补 开发 出 来 。 但 是 
内 存 安全 问题 依然 像 一 个 幽灵 一 样 ， 一 直 徘 徊 在 众多 程序 员 的 头顶 ， 
无 法 摆脱 。 再 多 的 努力 ， 也 只 能 减少 它 出 现 的 机 会 ， 很 难保 证 完整 地 
解决 挥 这 一 类 错误 。 


Rust 对 目 己 的 定位 是 接近 心 片 硬 件 的 系统 级 编程 语言 ， 因 此 ， 它 
不 可 能 选择 使 用 目 动 垃圾 回收 的 机 制 来 解决 问题 。 事 实证 明 ， 要 想 解 
决 内 存 安全 辣 题 ， 小 修 小 补 是 不 够 的 ， 必 须 摘 清 楚 寻 致 内 存 错 误 的 根 
本 原因 ， 从 源头 上 解决 。Rust 束 是 为 此 而 生 的 。Rnust 语 言 是 可 以 傈 证 
内 存 安全 的 系统 级 编程 语言 。 这 有 是 它 的 独特 的 优势 。 本 书 将 用 大 量 的 
篇 幅 详细 介绍 “内 存 安全 ”。 


并 发 


在 计算 机 单 核 性 能 越 来 越 接 近 竹 颂 的 今天 ， 多 核 并 行 成 了 提 融 软 
件 执行 效率 的 发 展 趋势 。 一 些 编程 语言 已 经 开始 从 语言 层面 支持 并 发 
编程 ， 把 “并 发 "的 概念 植 入 到 了 编程 语言 的 血液 中 。 然 而 ， 在 传统 的 
系统 级 编程 语言 中 ， 并 行 代码 很 容易 出 错 ， 而 且 有 些 问 题 很 难 复 现 ， 
难以 发 现 和 解决 问题 ，debug 的 成 本 非常 高 。 线 程 安 全 问题 一 直 以 来 都 
征 非常 令 人 头痛 的 问题 。 


Rust 当 然 也 不 会 在 这 一 重要 领域 落伍 ， 它 也 非常 好 地 支持 了 并 发 
编程 。 更 重要 的 是 ， 在 强大 的 内 存 安全 特性 的 文 持 下 ，Rust 一 举 解 决 
了 并 发 条 件 下 的 数据 竞争 (Data Race) 问题 。 它 从 编译 阶段 就 将 数据 
苋 争 解 决 在 了 萌 芷 状态 ,保障 了 线程 安全 。 


Rust 在 并 发 方面 还 具有 相当 不 错 的 可 扩展 性 。 所 有 跟 线 程 安 全 相 
天 的 特性 ， 都 不 是 在 编译 器 中 写 死 的 。 用 户 可 以 用 库 的 形式 实现 各 种 
高 效 且 安全 的 并 发 编程 模型 ， 进 而 充分 利用 多 核 时 代 的 硬件 性 能 。 


演 用 


Rust 并 不 只 十 实验 室 中 的 研究 型 产品 ， 它 的 目标 是 解决 目前 软件 
行业 中 实 实在 在 的 各 种 问题 。 它 的 实用 性 体现 在 方方面面 。 


Rust 编 译 姻 的 后 问 是 基于 著名 的 LLVM 完 成 机 右 码 生成 和 优化 
的 ， 它 只 需要 一 个 非常 小 巧 的 运行 时 即 可 工作 ， 执 行 效率 上 可 与 C 语 
言 相 媲美 ， 具 备 很 好 的 路 平台 特性 。 


Rust 按 痉 了 手动 内 存 管理 珊 来 的 各 种 不 安全 的 弊端 ， 同 时 也 避免 
了 自动 垃圾 回收 带 来 的 效率 损失 和 不 可 控 性 。 在 绝 大 部 分 情况 下 ， 保 
持 了 “无 额外 性 能 损失 ”的 抽象 能 力 。 


Rust 具 备 比 较 强 大 的 类 型 系统 ， 借 鉴 了 许多 现代 编程 语言 的 历史 
经 验 ， 包 含 了 众多 方便 的 语法 特性 。 其 中 包括 代数 类 型 系统 、 模 式 匹 
配 、 闭 包 、 生 成 大 、 类 型 推 灯 、 汉 型 、 与 C 库 ABI 兼 容 、 宏 、 模 块 管理 
机 制 、 内 置 开 源 库 发 布 和 管理 机 制 、 文 持 多 种 编程 范式 等 。 它 吸收 了 
许多 其 他 语言 中 优秀 的 抽象 能 力 ， 海 纳 百川 ， 兼 容 并 鞭 。 在 不 影响 安 
全 和 效率 的 情况 下 ， 拥 有 不 俗 的 抽象 表达 力 。 


有 意思 的 地 方 是 ， 在 程序 语言 设计 领域 ， 按 照 传统 思路 ， 有 些 设 


计 目标 是 互相 冲突 的 。 而 Rust 的 优异 之 处 在 于 ， 它 能 游 思 有 余地 游 走 
在 各 种 设计 目标 之 间 ， 扬 长 避 短 ， 保 持 良好 的 妥协 和 平衡 。 


本 书 结构 


本 书 将 详细 描述 Rust 语 言 的 基本 语法 ， 穿 插 讲解 一 部 分 高 级 使 用 
技巧 ， 并 尽量 以 更 容易 理解 的 方式 疝 读 者 解释 其 背后 的 设计 思想 。 语 
法 只 是 基础 ， 并 非 本 书 的 重点 ， 笔 者 更 布 望 读 者 能 理解 到 这 些 语法 设 
计 育 后 的 理念 ， 读 完 本 书 之 后 ， 可 以 从 中 受到 一 点 局 发 ， 对 程序 语言 
有 更 多 的 认识 ， 从 而 对 编程 本 号 有 更 深 的 理解 。 


Learning a language that is significantly different than you are used to 
is certainly tough at first，bnut it's a great way to expand your horizons a 
bit. 


在 本 书 中 ， 笔 者 尽量 避免 要 求 读者 有 很 多 的 基础 知识 。 当 然 ， 如 
果 读 者 对 其 他 的 一 种 或 多 种 编程 语言 有 所 了 解 更 佳 ， 其 中 包括 
C/C++ 的 基础 知识 、 内 存 错误 、 手 动 内 存 管 理 、 目 动 垃圾 回收 、 多 线 
程 并 发 和 同步 、 操 作 系 统 相关 的 基础 概念 等 。 
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第 一 部 分 介绍 Rust 基 本 语法 。 因 为 对 任何 程序 设计 语言 来 说 ， 语 
法 都 是 基础 ， 学 习 这 部 分 是 理解 其 他 部 分 的 前 提 。 


第 二 部 分 介绍 属于 Rust 独 一 无 二 的 内 存 管理 方式 。 它 设计 了 一 组 
全 新 的 机 制 ， 既 保证 了 安全 性 ， 又 保持 了 强大 的 内 存 布局 控制 力 ， 而 
且 没有 额外 性 能 损失 。 这 部 分 是 本 书 的 重点 和 核心 所 在 ， 是 Rust 语 言 
的 思想 内 核 精 信 之 处 。 


第 三 部 分 介绍 Rust 的 抽象 表达 能 力 。 它 文 持 多 种 编程 范式 ， 以 及 
较为 强大 的 抽象 表达 能 力 。 


第 四 部 分 介绍 并 发 模型 。 在 目前 这 个 阶段 ， 对 并 行 编程 的 文 持 旦 
新 一 代 编 程 语言 无 法 绕 过 的 重要 话题 。Rust 也 吸收 了 业界 最 新 的 发 展 
成 果 ， 对 并 发 有 民 好 文 持 。 


第 五 部 分 介绍 一 些 实用 设施 。Rust 语 言 有 许多 创新 ， 但 它 绝 不 是 
高 局 在 上 、 孤 廊 目 党 的 类 型 。 设 计 者 们 在 设计 过 程 中 充分 考虑 了 语言 
的 工程 实用 性 。 众 多 在 其 他 语言 中 被 证 明 过 的 优秀 实践 被 吸收 了 进 
来 ， 有 利于 提升 实际 工作 效率 。 


为 了 内 容 的 完整 性 ， 本 书 并 没有 严格 按照 知识 点 顺序 组 织 内 容 ， 
少数 地 方 会 直接 使 用 后 续 章 节 中 的 知识 点 。 笔 者 相信 对 读者 来 说 ， 这 
不 是 一 个 很 大 的 障碍 ， 各 位 读者 在 碰 到 这 种 情况 的 时 候 ， 可 以 目 行 前 
后 参照 来 理解 。 


总 结 和 勘误 


在 计算 机 程序 设计 语言 的 领域 中 ， 一 代 又 一 代 的 语言 潮 起 滑落 ， 
其 兴起 和 彭 落 的 节 委 往往 并 非 取决 于 技术 本 身 的 发 展 。 对 于 Rust 这 门 


新 出 现 的 语言 来 说 ， 以 后 究竟 会 有 多 大 的 影响 ， 是 否 会 成 为 取代 某 种 
语言 的 “新 时 代 的 宠儿 ”， 实 在 难以 预测 ， 而 且 坚 无 必要 预测 。 


笔者 认为 ，Rust 语 言 是 最 近 者 干 年 内 系统 级 编程 语言 领域 的 集 大 
成 者 之 一 。 不 论 其 最 终 发 展 如何 ， 它 的 许多 设计 思想 和 令 人 惊叹 的 特 
性 都 值得 大 家 学 习 。 在 本 人 的 学 习 过 程 中 ， 也 时 和 常 为 某 些 精彩 的 设计 
发 出 由 衷 的 赞叹 。 


Rust 语 言 是 一 门 优秀 的 语言 ， 同 时 也 是 门槛 较 高 的 一 门 语言 ， 要 
完全 掌握 它 不 是 一 件 很 容易 的 事 。 因 此 ， 笔 者 并 不 希望 将 本 书写 成 语 
言 特 性 的 逐一 简单 罗列 ， 而 更 希望 向 读者 解释 清楚 这 些 语言 特性 背后 
的 设计 思想 。 


所 幸 的 是 ，Rust 语 言 古 完全 开源 的 ， 不 仅 代 码 是 开源 的 ， 而 且 整 
个 设计 过 程 、 思 辩 讨 论 都 是 对 社区 完全 开放 的 。 它 的 许多 非 肖 有 价值 
的 学 习 资 料 ， 如 同 星星 点 点 ， 散 落 在 各 个 地 方 ， 包 括 冒 方 文档 、 邮 件 
列表 、 讨 论 组 、GitHub、 个 人 博客 等 。 在 学 习 和 写作 的 过 程 中 ， 能 有 
幸 一 条 新 语言 创造 者 们 的 心路 历程 ， 也 是 难得 的 机 缘 。 


要 想 把 Rust 语 言 的 方方面面 讲 好 、 讲 透 ， 实 在 是 一 个 无 比 繁重 的 
任务 。 动 笔 之 际 ， 方 知 “ 看 人 挑 担 不 吃力 ， 上 自家 挑 担 压 断 兰 ”， 诚 悍 诚 
鸡 ， 战 战 正 状 ， 生 民有 误 人 子弟 之 嫌 。 笔 者 水 平 有 限 ， 如 有 错漏 ， 在 
所 难免 ， 欢迎 读者 批评 指正 。 笔 者 将 会 在 GitHub 上 发 布 最 新 的 勘误 列 
表 ， 网 址 为 https://github.com/F001/rust_book_feedback 。 读 者 可 以 在 这 
个 项 目 中 新 建 bug 提 交 问 题 ， 也 可 以 通过 邮件 (rust-lang@qq.com) 与 
笔者 联系 。 同 时 也 欢迎 读者 关注 微 信 公 众 号 : Rust 编 程 ， 后 面 还 会 发 
布 更 多 关于 Rust 的 文章 。 
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第 一 部 分 “基础 知识 


在 这 一 部 分 中 ， 我 们 将 对 Rust 语 言 的 主要 语法 特性 做 一 个 循序 渐 
进 的 介绍 。Rust 语 言 的 基本 语法 特性 并 不 复杂 ， 它 也 并 没有 贫 多 求全 
地 堆砌 大 量 华而不实 的 语法 特性 。 相 反 ， 它 在 吸收 各 种 优秀 语法 规则 
的 同时 也 做 了 裁剪 ， 去 芜 存 背 ， 张 弛 有 展 。 


第 1 章 ”与 君 初 相 见 


Rust 编 程 语言 的 官方 网 站 是 https:/www.rust-lang.org/。 在 官网 主 
页 上 ,我 们 可 以 用 到 ， 在 最 时 服 的 位 置 ， 写 大 Rust 襄 训 最 童 要 的 特 


Rust is a systems programming language that runs blazingly fast, 


prevents segfaults, and guarantees thread safety. 


Rnust 语 言 是 一 门 系统 编程 语言 ， 它 有 三 大 特点 : 运行 快 
错误 、 保 证 线程 安全 。 


` 防止 段 


系统 级 编程 是 相对 于 应 用 级 编程 而 言 。 一般 来 说 ， 系统 级 编程 意 
味 着 更 底层 的 位 置 ， 它 更 接近 于 硬件 层次 ， 并 为 上 层 的 应 用 软件 提供 


文 持 。 系 统 级 编程 语言 一 般 具 有 以 下 特点 : 
可 以 在 资源 非常 受 限 的 环境 下 执行 ; 
:运行 时 开销 很 小 ， 非 第 高 效 ; 

“很 小 的 运行 库 ， 甚 至 于 没有 ; 
可 以 允许 直接 的 内 存 操作 。 


目前 ，C 和 C++ 应 该 是 业界 最 流行 的 系统 编程 语言 。Rust 的 定位 与 
它们 类 似 ， 但 是 增加 了 安全 性 。C 和 C++ 都 是 编译 型 语言 ， 无 须 规模 庞 


大 的 运行 时 (runtime) 支持 ， 也 没有 自动 内 存 回 收 (Garbage 
Collection) 机 制 。 


本 章 主要 对 Rust 做 一 个 简单 的 介绍 ， 准 备 好 一 些 基 本 概念 以 及 开 


发 环境 。 


1.1 版 本 和 发 布 抹 略 


Rnust 编 程 语言 是 开源 的 ， 编 译 器 的 源码 位 于 https:/Wgithub.comy/rust- 
lang/rust 项 目 中 ， 语 言 设计 和 相关 讨论 位 于 https://github.com/rust- 
lang/rfcs 项 目 中 。 对 于 想 深 入 人 研究 这 门 语言 的 读者 来 说 ， 这 是 一 个 非 
常 好 的 消 轧 ， 大 家 可 以 通过 人 研读 开放 的 源 代码 和 技术 文档 了 解 到 很 多 
书本 上 没有 讲解 过 的 知识 。 任 何 一 个 开发 者 都 可 以 直接 给 这 个 项 目 提 
bug， 或 者 直接 页 献 代码 。Rust 项 目 是 完全 由 开源 社区 管理 和 驱动 的 ， 
社区 的 氛围 非常 友好 。 


Rust 编 译 器 的 版 本 号 采用 了 “语义 化 版 本 号 ” (Semantic 
Versioning) 规划 。 在 这 个 规则 之 下 ， 版 本 格式 为 : 主 版 本 号 .次 版 本 
号 .修订 号 。 版 本 号 递增 规则 如 下 。 

. 主 版 本 号 : 当 你 做 了 不 兼容 的 API 修 改 

:次 版 本 号 : 当 你 做 了 向 下 兼容 的 功能 性 新 增 

.修订 号 : 当 你 做 了 回 下 兼容 的 问题 修正 

Rust 的 第 一 个 正式 版 本 号 是 1.0， 是 2015 年 5 月 发 布 的 。 从 那 以 
， 只 要 版 本 没有 出 现 大 规模 的 不 兼容 的 升级 ， 大 版 本 号 加 一 直 维持 
“1”， 而 次 版 本 号 会 逐步 升级 。Rust 一 般 以 6 个 星期 更 新 一 个 正式 版 
的 速度 进行 迭代 。 

为 了 兼顾 更 新 速度 以 及 稳定 性 ，Rust 使 用 了 多 渠道 发 布 的 策略 : 

"nightly 版 本 

:beta 版 本 

.Stable 版 本 

nightly 版 本 是 每 天 在 主 版 本 上 目 动 创建 出 来 的 版 本 ， 这 个 版 本 上 


的 功能 最 多 ， 更 新 最 快 ， 但 是 某 些 功能 存在 问题 的 可 能 性 也 更 大 。 
为 狐 功 能 会 首先 在 这 个 版 本 上 开启 ， 供 用 户 试 用 。beta 版 本 是 每 隔 一 


六 时 本 


段 时 间 ， 将 一 些 在 nightly 版 本 中 验证 过 的 功能 开放 给 用 户 使 用 。 它 可 
以 被 看 作 stable 版 本 的 “ 预 发 布 " 版 本 。 而 stable 版 本 则 是 正式 版 ， 它 每 
隅 6 个 星期 发 布 一 个 新 版 本 ， 一 些 实验 性 质 的 新 功能 在 此 版 本 上 无 法 使 
用 。 它 也 十 最 稳定 、 最 可 靠 的 版 本 。stable 版 本 古 保 证 癌 前 兼容 的 。 


在 nightly 版 本 中 使 用 试验 性 质 的 功能 ， 必 须 手 动 开启 feature gate 。 
也 就 是 说 要 在 当前 项 目的 入 口 文件 中 加 入 一 条 #1! [feature (. 
name...) ] 语 句 。 否 则 是 编译 不 过 的 。 等 到 这 个 功能 最 终 被 稳定 了 ， 再 
用 新 版 编译 絮 编 译 的 时 候 ， 它 会 警告 你 这 个 feature gate 现 在 是 多 余 的 
了 ， 可 以 去 掉 了 。 


Rust 语 言 相 对 重大 的 设计 ， 必 须 经 过 RFC (Request For 
Comments) 设计 步骤 。 这 个 步骤 主要 是 用 于 讨论 如 何 * 设 计 ” 语 言 。 这 
个 项 目 存 在 于 https://github.com/rust-lang/rfcs 。 所 有 大 功能 必须 先 写 好 
设计 文 要 ， 讲 清楚 设计 的 目标 、 实 现 方式 、 优 缺点 等 ， 让 整个 社区 参 
与 讨论 ， 然 后 由 “核心 组 ”(Core Team) 的 成 员 参 与 定夺 是 否 接受 这 个 
设计 。 笔 者 强烈 建议 各 位 读者 多 读 一 下 RFC 文 档 ， 许 多 深层 次 的 设计 
思想 问题 可 以 在 这 个 项 目 中 找到 答案。 在 Rust 社 区 ， 我 们 不 仅 可 以 看 
2 还 能 看 到 每 一 步 设 计 的 过 程 ， 对 我 们 来 说 非常 有 

育 意义 。 


Rust 语 言 每 个 相对 复杂 一 点 的 新 功能 ， 都 要 经 历 如 下 步 又 才 算 真 
正 稳定 可 用 : 


RFC— Nightly ~ Beta — Stable 


先 编写 一 份 RFC， 其 中 包括 这 个 功能 的 目的 、 详 细 设 计 方 案 、 优 
缺点 探讨 等 。 如 采 这 个 RFC 被 接受 了 ， 下 一 步 训 古 在 编译 硕 中 实现 这 
个 功能 ， 在 nightly 版 本 中 开局 。 经 过 几 个 星期 甚至 几 个 月 的 试用 之 
后 ， 根 据 反 馈 结 采 来 决定 撤销 、 修 改 或 者 接受 这 个 功能 。 如 果 表 现 不 
错 ， 它 融会 进入 beta 版 本 ， 继 续 过 几 个 星期 后 ， 如 果 确 实 没 发 现 什 么 
问题 ， 最 终 会 进入 stable 版 本 。 至 此 ， 这 个 功能 才 会 被 官方 正式 定 
为 “稳定 的 ”功能 ， 在 后 续 版 本 中 要 确保 兼容 性 的 。 


这 个 发 布 策 上 略 非常 成 功 ， 它 保证 了 新 功能 可 以 持续 、 快 速 地 进入 
到 编译 侣 中 。 在 这 个 发 布 策略 的 支持 下 ，Rust 语 言 以 及 编译 右 的 进化 
速度 非常 了 不 起 ， 成 功 实践 了 快速 迷 代 、 敏 捷 交 付 以 及 重视 用 尸 反 馈 
的 特点 ， 同 时 也 保证 了 核心 设计 的 稳定 性 一 一 用 户 可 以 根据 目 己 的 需 


要 和 风险 仿 好 ， 选 择 合适 的 版 本 。 本 书 假定 读者 安 狠 的 是 nightly 版 
0 目标 是 学 习 ， 目 前 有 许多 重要 的 功能 只 存在 于 nightly 


在 2017 年 下 半年 ，Rust 设 计 组 又 提出 了 一 个 基于 epoch 的 演进 策略 
(后 来 也 被 称 为 edition) 。 它 要 解决 的 问题 是 ， 如 何 让 Rust 更 平稳 地 
进化 。 比 如 ， 有 时 某 些 新 功能 确实 需要 一 定 程度 上 破坏 兼容 性 。 为 了 
最 大 化 地 减少 这 些 变动 给 用 户 市 来 的 影响 ，Rust 设 计 组 又 设计 了 一 个 
所 谓 的 edition 的 方案 。 简 单 来 说 束 是 让 Rust 的 兼容 性 保证 是 一 个 有 时 
限 的 长 度 ， 而 不 是 永久 。Rust 设 计 组 很 可 能 会 在 不 久 的 将 来 发 布 一 个 
2018 edition， 把 之 前 的 版 本 叫 作 2015 edition。 在 这 个 版 本 的 进化 过 程 
中 ， 就 可 以 实施 一 些 不 兼容 的 改变 。 当 然 了 ，Rust 设 计 组 不 会 突然 让 
前 一 个 edition 的 代码 到 了 后 一 个 edition 就 不 能 编译 了 。 他 们 采用 了 一 
种 平滑 过 渡 的 方案 。 


我 们 举 个 例子 。 假 设 我 们 要 添加 一 个 功能 ， 比 如 增加 一 个 关键 
字 。 这 件 事情 肯定 十 不 兼容 的 改变 ， 因 为 用 户 写 的 代码 中 很 可 能 包含 
用 这 个 关键 字 命 名 的 变量 、 函 数 、 类 型 等 ， 直 接 把 这 个 单词 改 成 关键 
字 会 直接 导致 这 些 遗 留 代码 出 现 编译 错误 。 那 怎么 办 呢 ? 首先 会 在 下 
一 个 edition 中 做 出 警告 ， 提 示 用 户 这 个 单词 已 经 不 适合 作为 变量 名 
了 ， 请 用 户 修改 。 但 是 这 个 阶段 代码 依然 能 编译 通过 。 人 然后 到 再 下 一 
个 edition 的 时 候 ， 这 个 警告 融会 变 成 真正 的 编译 错误 ， 此 时 这 个 关键 
字 承 可 以 真正 局 用 了 “。 欧 编译 警告 ， 再 编译 错误 ， 这 个 过 程 可 能 会 持 
续 好 几 年 ， 所 以 Rust 的 稳定 性 还 是 基本 上 有 保证 的 。 毕 竟 ， 如 果 要 维 
持 百 分 之 百 的 兼容 性 ，Rnust 语 言 减 很 难 再 继续 进化 了 。 如 果 让 极 少 一 
部 分 受 影响 的 遗留 代码 ， 完 全 锁 死 整个 语言 的 进步 空间 ， 对 于 那些 特 
别 需 要 某 些 新 功能 的 用 户 来 说 也 是 不 公平 的 。 通 过 这 个 绥 慢 过 站 的 入 
略 ， 基 本 可 以 让 所 有 Rust 的 使 用 者 乎 请 、 无 痛 地 过 渡 到 新 版 本 。 几 年 
的 过 流 时 间 也 是 足够 充分 的 。 


Rnust 的 标准 库 文 档 位 于 https:/doc.rust-lang.org/std/ 。 学 会 查阅 标 谁 
库 文 档 ， 是 每 个 Rust 使 用 者 的 必 备 技能 之 一 。 


1.2 ”安装 开发 环境 


Rnust 编 译 需 的 下 载 和 安装 方法 在 官网 上 有 文档 说 明 ， 点 击 官网 上 
的 Install 链 接 可 以 查看 。Rust 官 方 已 经 提供 了 预 编译 好 的 编译 器 供 我 们 
下 载 ， 支 持 Windows 平 台 、Linux 平 台 以 及 Mac 平 台 。 但 是 一 般 我 们 不 
单独 下 载 Rust 的 编译 器 ， 而 是 使 用 一 个 叫 rustup 的 工具 安装 Rust 相 天 的 
一 整套 工具 链 ， 包 括 编译 絮 、 标 准 库 、cargo 等 。 使 用 这 个 工具 ， 我 们 
还 可 以 轻易 地 更 新 版 本 、 切 换 渠道 、 多 工具 链 管理 等 。 


在 官网 上 下 载 rustup-init 程 序 ， 打开 命令 行 工 具 ， 执 行 这 个 程序 ， 
按照 提示 选择 合适 的 选项 即 可 。 不 论 在 Windows、Linux 还 是 Mac 操 作 
系统 上 ， 安 装 步 又 都 是 差不多 的 。 


在 Windows 平 台 下 的 选项 要 稍微 麻烦 一 点 。 在 Windows 平 台 上 ，， 
Rust 支 持 两 种 形式 的 ABI (Application Binary Interface) ， 一 种 是 原生 
的 MSVC 版 本 ， 另 一 种 是 GNU 版 本 。 如 果 你 需要 跟 MSVC 生 成 的 库 打 
交道 ， 就 选择 MSVC 版 本 ; 如 果 你 需要 跟 MinGW 生 成 的 库 打交道 ， 就 
选择 GNU 版 本 。 一 上 般 情 况 下 ， 我 们 选择 MSVC 版 本 。 在 这 种 情况 下 ， 
Rnust 编 译 器 还 需要 依赖 MSVC 提 供 的 链接 器 ， 因 此 还 需要 下 载 
VisualC++ 的 工具 链 。 到 Visual Studio 官 网 下 载 VS2015 或 者 VS2017 社 区 
版 ， 安 装 C++ 开发 工具 即 可 。 


安装 完成 之 后 ， 在 $SHOME/.cargo/bin 文 件 夹 下 可 以 看 到 一 系列 的 
可 执行 程序 ， 比 如 Rust 1.19 版 本 的 时 候 ， 在 Windows 平 台 上 安装 的 程 
序 如 图 1-1 所 示 。 


| cargo.exe 


cargo-fmt.exe 
| racer.exe 
rls.exe 
Ww rustc.exe 
| rustdoc.exe 
rustfmt.exe 
| rust-gdb.exe 


| rust-lldb.exe 


rustup.exe 
1-1 


其 中 ，rustc.exe 是 编译 嚣 ，cargo.exe 是 包 管理 器 ，cargo-fmt.exe 和 
within exe 是 源 代码 格式 化 工具 ，rust-gdb.exe 和 rust- lldb. exe 是 调试 名， 
rustdoc.exe 是 文档 生成 器 ，rls.exe 和 Tracerexe 是 为 编辑 器 准备 的 代码 提 
示 工 具 ，rustup.exe 是 管理 这 套 工 具 链 下 载 更 新 的 工具 。 


我 们 可 以 使 用 rustup 工 具 管理 工具 链 。 


// 更 新 rustup 本 身 
$ rustup self update 
// 御 载 rust 所 有 程序 

$ rustup self uninstall 
// 时 新 [ 具 链 

$ rustup update 


我 们 还 可 以 使 用 它 轻松 地 在 stable/betanightly 渠 道中 切换 ， 比 如 : 


// 安装 nightly 版 本 的 编译 工具 链 
$ rustup install nightly 


// 设置 默认 工具 链 是 nightly 版 本 
$ rustup default nightly 


为 了 提高 访问 速度 ， 中 国 科技 大 学 Linux 用 户 协 会 (USTC LUG) 
提供 了 一 个 代理 服务 ， 官 方 网 址 为 
https://lug.ustc.edu.cn/wiki/mirrors/help/rust-static ， 建 议 国 内 用 户 设 置 
好 以 下 环境 变量 再 使 用 rustup: 


export RUSTUP_DIST_ SERVER=https://mirrors.ustc,.edu.cn/rust-static 
export RUSTUP_UPDATE_ ROOT=https://mirrors.ustc,.edu.cn/rust-static/rustup 


Rust 官 方 工具 链 还 提供 了 重要 的 包 管 理工 具 cargo.exe， 我 们 可 以 
通过 这 个 工具 轻松 导入 或 者 发 布 开源 库 。 官 方 的 管理 仓库 在 
https://crates.io/ ， 大 家 可 以 登录 这 个 网 站 浏览 一 下 Rust 社 区 热门 的 开源 
库 都 有 哪些 。 大 型 项 目 往 往 需要 依赖 这 些 开 源 库 ，cargo 会 帮 有 我 们 上 自动 
下 载 编 译 。 同 样 ， 为 了 解决 网 络 问题 ， 需 要 利用 USTC 提 供 的 代理 服 
务 ， 使 用 方式 为 : 在 $HOME/.cargo 目 孙 下 创建 一 个 名 为 config 的 文本 
文件 ， 其 内 容 为 : 


[source.crates-io] 

registry = "https://github.com/rust-lang/crates.io-index" 
replace-with = 'ustc' 

[source.ustc] 

registry = "git://mirrors.ustc.edu,.cn/crates.io-index" 


这 样 ， 在 编译 需要 依赖 crates.io 的 项 目 时 ， 不 会 由 于 网 络 问题 导致 
依赖 库 下 载 失 败 。 


RLS (Rust Language Server) 是 官方 提供 的 一 个 标准 化 的 编辑 壤 
增强 工具 。 它 也 是 开源 的 ， 项 目地 址 在 https://github.com/rust-lang- 
nursery/rls 。 它 是 一 个 单独 的 进程 ， 通 过 进程 间 通 信 给 编辑 器 或 者 集成 
开发 环境 提供 一 些 信息 ， 实 现 比较 复杂 的 功能 ， 比 如 代码 自动 提示 、 
跳 转 到 定义 、 显 示 琅 数 签名 等 。 安 装 最 新 的 RLS 的 方法 为 : 


// 更 新 rustup 到 最 新 
rustup self update 

// 更 新 rust 编 译 器 到 最 新 的 nightly 版 本 
rustup update nightly 

// 安装 RLS 

rustup component add rls --toolchain nightly 


rustup component add rust-analysis --toolchain nightly 
rustup component add rust-src --toolchain nightly 


有 了 这 些 准备 ， 大 家 就 可 以 在 Visual Studio Code 中 下 载 支 持 Rust 
的 插件 ， 提 升 编辑 体验 。 理 论 上 来 说 ，RLS 可 以 跟 任何 编辑 器 或 者 集 
成 开发 环境 配合 使 用 ， 只 要 这 个 编辑 器 实现 了 它们 之 间 的 通信 协议 即 


可 。 


有 了 上 面 这 些 准备 工作 ， 我 们 就 可 以 正式 开始 Rust 编 程 之 旅 了 。 
首先 ， 打 开 命 令 行 工具 ， 看 看 rustc 编 译 需 能 否 正常 运行 ， 使 用 -V 命 令 
查看 rustc 的 版 本 : 


$ rustc -V 
rustc 1.20.0-nightly (f85579d4a 2017-07-12) 


如 采 看 到 类 似 的 输出 ， 说 明 编 译 亏 已 经 可 以 正常 工作 。 接 下 来 ， 
请 大 家 探索 一 下 这 些 工具 的 简明 使 用 帮助 : 


1) 使 用 rustc-h 命 令 查看 rustc 的 基本 用 法 ; 

2) 使 用 cargo-h 命 令 查看 cargo 的 基本 用 法 ; 

3) 使 用 rustc-C help 命 令 查 看 rustc 的 一 些 跟 代 码 生成 相关 的 选项 ; 
4) 使 用 rustc-W help 命 令 碍 看 rustc 的 一 些 跟 代码 警告 相关 的 选 


5) 使 用 rustc-Z help 命 令 查 看 rustc 的 一 些 跟 编译 器 内 部 实现 相关 的 
选项 ; 


6) 使 用 rustc-help-V 命 令 查看 rustc 的 更 详细 的 选项 说 明 。 


1.3 Hello World 


编程 语言 入 门 第 一 课 ， 必 须 得 是 hello world 程 序 。 我 们 先 来 看 看 
Rust 的 hello world 是 什么 样子 : 


// hello world.rs 

fn main() { 
let s = "hello world!",; 
println!("{}", s); 

} 


对 于 这 样 一 个 位 单 的 示例 程序 ， 我 们 并 没有 使 用 cargo 创 建 工程 ， 
人 es "编译 就 直接 使 用 rustc 即 可 ， 其 他 所 有 选项 
灼 认 值 : 


rustc hello world.rs 


可 看 到 本 地 文件 夹 中 生成 了 一 个 名 为 hello_world 的 可 执行 程序 。 
执行 ./hello_world 程 序 ， 可 以 看 见 控制 台 上 输出 了 hello world! 字符 
串 。 恭 喜 读 者 ， 第 一 个 Rust 程 序 已 经 运行 成 功 了 ! 


我 们 来 分 析 一 下 这 个 最 简单 的 程序 。 


1) 一 般 Rust 源 代码 的 后 级 名 使 用 .rs 表示 。 源 码 一 定 要 注意 使 用 
utf-8 编 码 。 


2) 第 一 行 是 注释 语句 ，Rnust 的 注释 是 C 语 言 系列 风格 的 ， 行 注释 
采用 /开头 ， 块 注释 使 用 * 和 鸡 包围。 它 还 文 持 更 高 级 的 文档 注释 ， 将 
在 后 文中 详细 展开 说 明 。 


3) fn 是 一 个 关键 字 (key word) ， 画 数 定义 必须 以 这 个 关键 字 开 
头 。 函 数 体 使 用 大 括号 来 包含 。f 名 是 单词 function 的 缩写 ， 在 Rust 中 
设计 者 比较 偏 回 使 用 单词 缩写 ， 即 使 是 关键 字 也 不 例外 。 在 代码 风格 
上 ， 某 些 读者 可 能 开始 会 有 点 不 习惯 。 但 总 体 而 言 ， 这 只 是 个 审美 偏 
好 而 已 ， 不 必 过 于 纠结 ， 习 惯 束 好 。 


4) 默认 情况 下 ，main 函 数 是 可 执行 程序 的 入 口 点 ， 它 是 一 个 无 参 
数 ， 无 返回 值 的 函数 。 如 采 我 们 要 定义 的 琅 数 有 参数 和 返回 值 ， 可 以 
使 用 以 下 语法 (参数 列表 使 用 去 号 分 开 ， 冒 号 后 面 是 类 型 ， 返回 值 类 
型 使 用 -> 符号 分 隔 ) : 


fn Foo( input1 : i32, input2 : U32) -> i32 { 


} 


5) 局 部 变量 声明 使 用 let 关 键 字 开头 ， 用 双 引 号 包含 起 来 的 部 分 是 
字符 串 币 量 。Rnust 是 静态 强 类 型 语言 ， 所 有 的 变量 都 有 产 格 的 编译 期 
语法 检查 。 关 于 Rust 的 变量 和 类 型 系统 将 在 后 文 详 细 说 明 。 


6) 每 条 语句 使 用 分 号 结尾 。 语 句 块 使 用 大 括号 。 空 格 、 换 行 和 缩 
进 不 是 语法 规则 的 一 部 分 。 这 都 是 明显 的 C 语 言 系列 的 风格 。 


最 简单 的 标准 输出 是 使 用 printin ! 宏 来 完成 。 请 大 家 一 定 注意 
printIn 后 面 的 感叹 号 ， 它 代表 这 古 一 个 宏 ， 而 不 是 一 个 函数 。Rust 中 的 
宏 与 C/C++ 中 的 宏 是 完全 不 一 样 的 东西 。 人 简单 点 说 ， 可 以 把 它 理解 为 
一 种 安全 版 的 编译 期 语法 扩展 。 这 里 之 所 以 使 用 宏 ， 而 不 是 函数 ， 是 
因为 标准 输出 宏 可 以 完成 编译 期 格式 检查 ， 更 加 安全 。 


从 这 个 小 程序 的 怀 鸿 一 警 中 ， 大 家 可 以 看 到 ，Rnust 的 语法 主要 还 
是 C 系 列 的 语法 风格 。 对 于 熟悉 C/C++/Java/CWPHP/JavaScript 等 语言 的 
读者 来 说 ， 会 看 到 许多 熟悉 的 身影 。 


1.4 Prelude 


Rust 的 代码 从 逻辑 上 是 分 crate 和 mod 管 理 的 。 所 谓 crate 大 家 可 以 理 
解 为 “项 目 ”。 每 个 crate 是 一 个 完整 的 编译 单元 ， 它 可 以 生成 为 一 个 lib 
或 者 exe 可 执行 文件 。 而 在 crate 内 部 ， 则 是 由 mod 这 个 概念 管理 的 ， 所 
谓 mod 大 家 可 以 理解 为 namespace。 我 们 可 以 使 用 use 语 句 把 其 他 模块 中 
的 内 容 引 入 到 当前 模块 中 来 。 关 于 Rust 模 块 系统 的 详细 说 明 ， 可 参见 
本 书 第 五 部 分 。 


Rust 有 一 个 极 简 标准 库 ， 叫 作 std， 除 了 极 少数 嵌入 式 系统 下 无 法 
使 用 标准 库 之 外 ， 绝 大 部 分 情况 下 ， 我 们 都 需要 用 到 标准 库 里 面 的 东 

西 。 为 了 给 大 家 减少 麻烦 ，Rnust 编 译 器 对 标准 库 有 特殊 处 理 。 默 认 情 

况 下 ， 用 户 不 需要 手动 添加 对 标准 库 的 依赖 ， 编 译 句 会 目 动 引 入 对 标 
准 库 的 依赖 。 除 此 之 外 ， 标 准 库 中 的 某 些 type 、trait、function、macro 
等 实在 是 太 常 用 了 。 每 次 都 写 use 语 句 确实 非常 无 聊 ， 因 此 标准 库 提 供 
了 一 个 std: : prelude 模 块 ， 在 这 个 模块 中 导出 了 一 些 最 常见 的 类 型 、 

trait 等 东西 ， 编 译作 会 为 用 户 写 的 每 个 crate 目 动 插 入 一 句 话 : 


use std::prelude::*; 


这 样 ， 标 准 库 里 面 的 这 些 最 重要 的 类 型 、trait 等 名 字 就 可 以 直接 
使 用 ， 而 无 须 每 次 都 写 全 称 或 者 use 语 句 。 


Prelude 模 块 的 源码 在 srclibstd/prelude/ 文 件 夹 下 。 我 们 可 以 看 到 
目前 的 modrs 中 ， 直 接 导 出 了 v1 模 块 中 的 内 容 ， 而 vlrs 中 ， 则 是 编译 
怖 为 我 们 上 自动 导入 的 相关 trait 和 类 型 。 


1.5 Format 格 式 详 细 说 明 

在 后 面 的 内 容 中 ， 我 们 还 会 大 量 使 用 printn! 宏 ， 因 此 提前 介绍 
一 下 这 个 宏 的 基本 用 法 。 跟 C 语 言 的 printf 函 数 类 似 ， 这 个 宏 也 文 持 各 
种 格式 控制 ， 示 例如 下 : 


fn main() { 


println!("{}", 1); // 默认 用 法 ,打印 Display 

println!("{:0}", 9); // 八进制 

printlin!("{:x}", 255); // 十 六 进 制 小 写 

println!("{:X}", 255); / 六 进 制 大 写 

printin!("{:p}", &0); // 指针 

printin!("{:b}", 15); // 二 进 制 

println!("{:e}"，10000f32);  ”// 科学 计数 (小 写 ) 
println!("{:E}"，140000f32);  // 科学 计数 (大 写 ) 

println!i("{:?}", "test"); // 打印 Debug 

println!("{:#?}", ("test1i", "test2")); // 带 换行 和 缩 进 的 Debug 打印 


printlnl("fal {fb} {bj"，a = "x"，b = "y");  // 命名 参数 


Rust 中 还 有 一 系列 的 宏 ， 都 是 用 的 同样 的 格式 控制 规则 ， 如 
format! write! writeln! 等 。 详 细 文 档 可 以 参见 标准 库 文 档 中 std: : 
fmt 模 块 中 的 说 明 。 


Rust 标 准 库 中 之 所 以 设计 了 这 么 一 个 宏 来 做 标准 输出 ， 主 要 是 为 
了 更 好 地 错误 检查 。 大 家 可 以 试 试 ， 如 果 出 现 参数 个 数 、 格 式 等 各 种 
原因 不 匹配 会 直接 导致 编译 错误 。 而 函数 则 不 具备 字符 串 格 式 化 的 静 
态 检 查 功 能 ， 如 有 果 出 现 了 不 匹配 的 情况 ， 只 能 是 运行 期 错误 。 这 个 安 
最 终 还 是 调用 了 std: : io 模块 内 提供 的 一 些 函 数 来 完成 的 。 如 采用 户 
需要 更 精细 地 控制 标准 输出 操作 ， 也 可 以 直接 调用 标准 库 来 完成 。 


Rnust 的 变量 必须 移 声 明 后 使 用 。 对 于 局 部 变量 ， 节 稼 见 的 声明 语 
法 为 : 


let variable : i32 = 100 |， 


与 传统 的 C/C++ 语言 相 比 ，Rust 的 变量 声明 语法 不 同 。 这 样 设计 
主要 有 以 下 几 个 方面 的 考虑 。 


1. 语 法 分 析 更 容易 


从 语法 分 析 的 角度 来 说 ，Rust 的 变量 声明 语法 比 C/C++ 语 言 的 简 
单 ， 局 部 变量 声明 一 定 是 以 关键 字 let 开 头 ， 类 型 一 定 是 跟 在 冒号 : 的 
后 面 。 语 法 下 义 更 少 ， 语 法 分 析 顺 更 容易 编写 。 


2. 方 便 引 入 类 型 推导 功能 


Rust 的 变量 声明 的 一 个 重要 特点 是: 要 声明 的 变量 前 置 ， 对 它 的 
类 型 撒 述 后 置 。 这 也 是 吸取 了 其 他 语言 的 教训 后 的 结 采 。 因 为 在 变量 
声明 语句 中 ， 最 重要 的 是 变量 本 映 ， 而 类 型 其 实 是 个 附属 的 额外 描 
述 ， 并 非 必 不 可 少 的 部 分 。 如 来 我 们 可 以 通过 上 下 文 环境 由 编译 右 目 
动 分 析出 这 个 变量 的 类 型 ， 那 么 这 个 类 型 搬 述 完全 可 以 省 略 不 写 。 
I 
合适 。 


3. 人 模式 解构 


let 语 句 不 光 是 局 部 变量 声明 语句 ， 而 且 具 有 pattern destructure ( 模 
式 解构 ) 的 功能 。 关 于 “模式 解构 ”的 内 容 在 后 面 的 章节 会 详细 描述 。 


实际 上 ， 包 括 C++/C#/Java 等 传统 编程 语言 都 开始 逐步 引入 这 种 声 
明 语 法 ， 目 的 是 相似 的 。 


Rust 中 声明 变量 缺 省 是 “只 读 ” 的 ， 比 如 如 下 程序 : 


fn main() { 
let x = 5; 
x = 10; 
} 


会 得 到 “re-assignment of immutable variable x`” 这 样 的 编译 错误 。 


如 有 果 我 们 需要 让 变量 古 可 写 的 ， 那 么 需要 使 用 mut 关 键 子 : 


let mut x = 5; // mut x: i32 
x = 10; 


此 时 ， 变 量 x 才 是 可 读 写 的 。 


实际 上 ，let 语 句 在 此 处 引入 了 一 个 模式 解构 ， 我 们 不 能 把 let mut 
视 为 一 个 组 合 ， 而 应 该 将 mut x 视 为 一 个 组 合 。 


mut x 是 一 个 “模式 ”， 我 们 还 可 以 用 这 种 方式 同时 声明 多 个 变量 : 


let (mut a, mut b) 


= (1, 2); 
Jet Point { x: ref a, y: r 


ef b} = p; 


其 中 ， 赋 值 号 左边 的 部 分 是 一 个 “模式 ”， 第 一 行 代码 是 对 tuple 的 
模式 解构 ， 第 二 行 代码 是 对 结构 体 的 模式 解构 。 所 以 ， 在 Rust 中 ， 一 
般 把 声明 的 局 部 变量 并 初始 化 的 语句 称 为 “变量 绑 定 ”， 强 调 的 是 “ 绑 
定 ” 的 含义 ， 与 C/C++ 中 的 “峰值 初始 化 ”语句 有 所 区 别 。 


Rust 中 ， 每 个 变量 必须 被 合理 初始 化 之 后 才能 被 使 用 。 使 用 未 初 
人 化 变量 这 样 的 错误 ， 在 Rust 中 是 不 可 能 出 现 的 (利用 unsafe 做 hack 除 
外 ) 。 如 下 这 个 简单 的 程序 ， 也 不 能 编译 通过 : 


fn main() { 
let x: i32,; 
println!("{}", x); 


错误 信息 为 : 


error: use of possibly uninitialized variable: ‘x. 


编译 名 会 帮 我 们 做 一 个 执行 路 径 的 静态 分 析 ， 确 保 变 量 在 使 用 前 一 定 
被 初始 化 : 
fn test(condition: bool) { 


let x: i32; // 声明 x, 不 必 使 用 mut 修饰 
If condition 区 


Xx = 1; // 初始 化 x, 不 需要 x 是 mut 的 , 因为 这 是 初始 化 ,不 是 修改 


println!("{}", x); 


} 
// 如 果 条 件 不 满足 , x 没有 被 初始 化 


// 但 是 没关系 , 只 要 这 里 不 使 用 x 就 没事 


类 型 没有 “ 寺 认 构造 函数 ”"， 变 量 没有 “默认 值 ”。 对 于 let x: i32; 
如 果 没 有 显 式 赋值 ， 它 惑 没 有 被 初始 化 ， 不 要 想当然 地 以 为 它 的 值 是 
0 oO 


Rust 里 的 合法 标识 符 (包括 变量 名 、 函 数 名 、trait 名 等 ) 必须 由 数 
字 、 字 母 、 下 划 线 组 成 ， 且 不 能 以 数字 开头 。 这 个 规定 和 许多 现 有 的 
编程 语言 是 一 样 的 。Rust 将 来 会 允许 其 他 Unicode 字 符 做 标识 符 ， 只 是 
目前 这 个 功能 的 优先 级 不 高 ， 还 没有 最 终 定 下 来 。 另 外 还 有 一 个 raw 
identifier 功 能 ， 可 以 提供 一 个 特殊 语法 ， 如 r#selff， 让 用 户 可 以 以 关键 
0 。 这 只 是 为 了 应 付 某 些 特殊 情况 时 迫不得已 的 做 
二 


Rust 里 面 的 下 划 线 是 一 个 特殊 的 标识 符 ， 在 编译 器 内 部 它 是 被 特 
2 。 它 跟 其 他 标识 符 有 许多 重要 区 别 。 比 如 ， 以 下 代码 瓯 编译 
NU: 


fn main() { 
let = "hello"; 


println!("{}", _); 


我 们 不 能 在 表达 式 中 使 用 下 划 线 来 作为 普通 变量 使 用 。 下 划 线 表 
达 的 含义 是 “忽略 这 个 变量 绑 定 ， 后 面 不 会 再 用 到 了 ”。 在 后 面 讲 析 构 
的 时 候 ， 还 会 提 到 这 一 点 。 


2.1.1 变量 遮蔽 


Rust 人 允许 在 同一 个 代码 块 中 声明 同样 名 字 的 变量 。 如 采 这 样 做 ， 
后 面 声明 的 变量 会 将 前 面 声明 的 变量 “ 遮 珊 ”(\Shadowing) 起 来 。 


fn main() { 
let x = "hello"; 
println!i("x is {}", x); 


let x = 5; 
println!i("x is {}", x); 


} 


上 面 这 个 程序 是 可 以 编译 通过 的 。 请 注意 第 5 行 的 代码 ， 它 不 是 
x=5; ， 它 前 面 有 一 个 let 关 键 字 。 如 果 没 有 这 个 le 关键 字 ， 这 条 语句 
就 是 对 x 的 重新 绑 定 (重新 赋值 。 而 有 了 这 个 let 关 键 字 ， 就 是 又 声明 
了 一 个 新 的 变量 ， 只 是 它 的 名 字 恰 巧 与 前 面 一 个 变量 相同 而 已 。 


但 十 这 两 个 x 代表 的 内 存 空间 完全 不 同 ， 类 型 也 完全 不 同 ， 它 们 实 
际 上 有 是 两 个 不 同 的 变量 。 从 第 5 行 开 始 ， 一 直到 这 个 代码 块 结束 ， 我 们 
没有 任何 办 法 再 去 访问 前 一 个 x 变量 ， 因 为 它 的 名 字 已 经 个 扩 敬 了 。 


变量 遮蔽 在 某 些 情况 下 非常 有 用 ， 比 如 ， 我 们 需要 在 同一 个 函数 
内 部 把 一 个 变量 转换 为 另 一 个 类 型 的 变量 ， 但 又 不 想 给 它们 起 不 同 的 
名 字 。 再 比如 ， 在 同一 个 函数 内 部 ， 需 要 修改 一 个 变量 绑 定 的 可 变 
性 。 例 如 ， 我 们 对 一 个 可 变数 组 执行 初始 化 ， 布 望 此 时 它 是 可 读 写 
的 ， 但 是 初始 化 完成 后 ， 我 们 希望 它 是 只 读 的 。 可 以 这 样 做 : 


// 注意 : 这 段 代 码 只 是 演示 变量 遮蔽 功能 , 并 不 是 Vec 类 型 的 最 佳 初始 化 方法 
fn main() { 


let mut v = Vec: :new(); // v 必须 是 mut 修 饰 , 因为 我 们 需要 对 它 写 入 数据 

v.push(1); 

v.push(2); 

v.push(3); 

let v= v; // 从 这 里 往 下 , v 成 了 只 读 变 量 , 可 读 写 变量 v 已 经 被 遮蔽 ,无 法 
再 访问 


for i in &v { 


println!("{}", 1); 


有 反 过 来 ， 如 有 果 一 个 变量 十 不 可 变 的 ， 我 们 也 可 以 通过 变量 迟 蔽 创建 一 


i 量 是 
个 新 的 、 可 变 的 同名 变量 。 


fn main() { 
let v = Vec::new(); 
Jet mut v = v; 
v.push(1); 
println!i("{:?}", VvV); 


请 注 意 ， 这 个 过 程 是 符合 “内 存 安全 ”的 。“ 内 存 安全 ”的 概念 一 直 
是 Rust 关 注 的 重点 ， 我 们 将 在 第 二 部 分 详细 讲述 。 在 上 面 这 个 示例 
中 ， 我 们 需要 理解 的 是 ， 一 个 “不 可 变 绑 定 ” 依 然 是 一 个 “变量 ”。 虽 然 
我 们 没 办 法 通过 这 个 “变量 绑 定 ”修改 变量 的 值 ， 但 是 我 们 重新 使 用 “可 
变 绑 定 ”之 后 ， 还 是 有 机 会 修改 的 。 这 样 做 并 不 会 产生 内 存 安全 问题 ， 
因为 我 们 对 这 块 内 存 拥有 完整 的 所 有 权 ， 且 此 时 没有 任何 其 他 引用 指 
癌 这 个 变量 ， 对 这 个 变量 的 修改 是 完全 合法 的 。Rust 的 可 变性 控制 规 
则 与 其 他 语言 不 一 样 。 更 多 内 容 请 参阅 本 书 第 二 部 分 内 存 安全 。 


实际 上 ， 传 统 编 程 语言 C/C++ 中 也 存在 类 似 的 功能 ， 只 不 过 它们 
只 允许 符 套 的 区 域内 部 的 变量 出 现 遮 蔽 。 而 Rust 在 这 方面 放 得 稍微 宽 
一 点 ， 同 一 个 语句 块 内 部 声明 的 变量 也 可 以 发 生 遮 巩 。 


2.1.2 ”类 型 推导 


Rust 的 类 型 推导 功能 是 比较 强大 的 。 它 不 仅 可 以 从 变量 声明 的 当 
前 语句 中 获取 信息 进行 推导 ， 而 且 还 能 通过 上 下 文 信息 进行 推导 。 


fn main() { 
// 没有 明确 标 出 变量 的 类 型 , 但 是 通过 字面 量 的 后 组 ， 
// 编译 器 知道 6lem 的 类 型 为 u8 


// 创建 一 个 动态 数组 , 数组 内 包含 的 是 什么 元 素 类 型 可 以 不 写 
let mut vec = Vecl:new( )， 

vec.push(elem); 
// 到 后 面 调用 了 push 函 数 , 通过 elem 变 量 的 类 型 ， 
// 编译 器 可 以 推导 出 vec 的 实际 类 型 是 Vec<u8> 


println!("{:?}", vec); 


我 们 甚至 还 可 以 只 写 一 部 分 类 型 ， 和 狮 下 的 部 分 让 编译 絮 去 推导 ， 
比如 下 面 的 这 个 程序 ， 我 们 只 知道 players 变 量 是 Vec 动 态 数组 类 型 ， 但 
是 里 面包 含 什么 元 素 类 型 并 不 清楚 ， 可 以 在 尖 括 号 中 用 下 划 线 来 代 


幸 ， 


fn main() { 
let player_scores = 
("Jack", 20), ("Jane", 23), ("Jill", 18), ("John", 19), 
]; 


// players 是 动态 数组 , 内 部 成 员 的 类 型 没有 指定 , 交 给 编译 器 自动 推导 
let players : Vec< > = player_scores 
.iter() 
.map(|&(player, _score)| { 
player 


.collect(); 


println!("{:?}", players); 


目 动 类 型 推导 和 “动态 类 型 系统 ”是 两 码 事 。Rust 依 然 是 静态 类 型 

的 。 一 个 变量 的 类 型 必须 在 编译 阶段 确定 ， 且 无 法 更 改 ， 只 是 菏 些 时 

8 中 显 式 写 出 来 而 已 。 这 只 是 编译 器 给 我 们 提供 的 一 个 
助 工具 。 


Rust 只 允许 “局 部 变量 /全 局 变量 "实现 类 型 推导 ， 而 画 数 签名 等 声 
景 下 是 不 允许 的 ， 这 是 故意 这 样 设计 的 。 这 是 因为 局 部 变量 只 有 局 部 
的 影响 ， 全 局 变量 必须 当场 初始 化 而 画 数 签名 具有 全 局 性 影响 。 画 数 
签名 如 果 使 用 自动 类 型 推导 ， 可 能 导致 某 个 调用 的 地 方 使 用 方式 发 生 
变化 ， 它 的 参数 、 返 回 值 类 型 就 发 生 了 变化 ， 进 而 导致 远 处 男 一 个 地 
方 的 编译 错误 ， 这 是 设计 者 不 希望 看 到 的 情况 。 


2.1.3 ”类 型 别名 


, I (type alias) 。 示 例 
虽 下: 


type Age = u32; 


fn grow(age: Age, year: U32) -> Age { 
age + year 


fn main() { 

let x : Age = 20; 

println!("20 years later: {}", grow(x, 20)); 
} 


类 型 别名 还 可 以 用 在 沁 型 场景 ， 比 如 : 


type Double<T> = (T，Vec<T>); // 小 括号 包围 的 是 一 个 tuple, 请 参见 后 文中 的 复合 数据 类 型 


那么 以 后 使 用 Double<i32> 的 时 候 ， 束 等 同 于 (i32，Vec<i32>) ， 
可 以 简化 代码 。 


2.1.4 静态 变量 
Rust 中 可 以 用 static 关 键 字 声明 静态 变量 。 如 下 上 所 示 : 


static GLOBAL: i32 = 0; 


与 let 语 句 一 样 ，static 语 句 同 样 也 是 一 个 模式 匹配 。 与 let 语 句 不 同 
的 是 ， 用 static 声 明 的 变量 的 生命 周期 是 整个 程序 ， 从 启动 到 退出 。 
static 变 量 的 生命 周期 永远 是 'static， 它 占用 的 内 存 空间 也 不 会 在 执行 过 
程 中 回收 。 这 也 是 Rust 中 唯一 的 声明 全 局 变量 的 方法 。 


由 于 Rust 非 第 注重 内 存 安 全 ， 因 此 全 局 变量 的 使 用 有 许多 限制 。 
这 些 限 制 都 是 为 了 防止 程序 员 写 出 不 安全 的 代码 : 


全 局 变量 必须 在 声明 的 时 候 马 上 初始 化 ; 


:全 局 变量 的 初始 化 必须 十 编译 期 可 确定 的 常量 ， 不 能 包括 执行 期 
才能 确定 的 表达 式 、 语 句 和 函数 调用 ; 


- 带 有 mut 修 饰 的 全 局 变量 ， 在 使 用 的 时 候 必 须 使 用 unsafe 关 键 子 。 


示例 如 下 : 


fn main() { 


// 局 部 变量 声明 , 可 以 留待 后 面 初始 化 ,只 要 保证 使 用 前 已 经 初始 化 即 可 
let x; 
let y = 1 i32; 
x = 2_i32,; 


println!("{} {}", x, y); 


// 全 局 变量 必须 声明 的 时 候 初始 化 ,因为 全 局 变量 可 以 写 到 函数 外 面 , 被 任意 一 个 函数 使 
static G1 : i32 = 3; 
println!("{}", G1); 


// 可 变 全 局 变量 无 论 读 写 都 必须 用 unsafe 修 饰 
static mut G2 : i32 = 4; 
unsafe { 
G2 = 5) 
println!("{}", G2); 


// 全 局 变量 的 内 存 不 是 分 配 在 当前 画 数 栈 上 , 画 数 退出 的 时 候 , 并 不 会 销毁 全 局 变量 占用 的 内 存 空间 , 程序 退出 
才 会 回收 
} 


Rust 禁 止 在 声明 static 变 量 的 时 候 调 用 普通 函数 ， 或 者 利用 语句 块 
调用 其 他 非 const 代 码 : 


// 这 样 是 允许 的 
static array : [i32; 3] = [1,2,3]; 

// 这 样 是 不 允许 的 

static vec : Vec<i32> ={ let mut v = Vec::new(); Vv.push(1); v }; 


调用 const fn 是 允许 的 : 


#![feature(const_fn)] 
fn main() { 
use std::sync::atomic::AtomicBool; 
static FLAG: AtomicBool = AtomicBool: :new(true); 


因为 const fn 是 编译 期 执行 的 。 这 个 功能 在 编写 本 书 的 时 候 目 前 还 
没有 stable， 因 此 和 需要 使 用 nightly 版 本 并 打开 feature gate 才 能 使 用 。 


Rust 不 允许 用 户 在 main 函 数 之 前 或 者 之 后 执行 目 己 的 代码 。 所 
以 ， 比 较 复 杂 的 static 变 量 的 初始 化 一 般 需 要 使 用 lazy 方 式 ， 在 第 一 次 


使 用 的 时 候 初 始 化 。 在 Rust 中 ， 如 果 用 户 需 要 使 用 比较 复杂 的 全 局 变 
量 初 始 化 ， 推 荐 使 用 lazy_static 库 。 


2.1.5 ”常量 
在 Rust 中 还 可 以 用 const 关 键 字 做 声明 。 如 下 所 示 : 


const GLOBAL: i32 = 0; 


使 用 const 声 明 的 是 常量 ， 而 不 是 变量 。 因 此 一 定 不 允许 使 用 mut 
关键 字 修 饰 这 个 变量 绑 定 ， 这 是 语法 错误 。 常 量 的 初始 化 表达 式 也 一 
定 要 是 一 个 编译 期 常量 ， 不 能 是 运行 期 的 值 。 它 与 static 变 量 的 最 大 区 
别 在 于 : 编译 器 并 不 一 定 会 给 const 常 量 分 配 内 存 空间 ， 在 编译 过 程 
中 ， 它 很 可 能 会 被 内 联 优化 。 因 此 ， 用 户 千 万 不 要 用 hack 的 方式 ， 通 
过 unsafe 代 码 去 修改 常量 的 值 ， 这 么 做 是 没有 意义 的 。 以 const 声 明 一 
个 常量 ， 也 不 具备 类 似 let 语 句 的 模式 匹配 功能 。 


2.2 ”基本 数据 类 型 
2.2.1 bool 


布尔 类 型 (bool) 代表 的 是 “是 ”和 “ 否 ” 的 二 值 逻 辑 。 它 有 两 个 值 : 
true 和 和 false。 一般 用 在 逻辑 表达 式 中 ， 可 以 执行 “与 或“ 非 * 等 运算 。 


fn main() { 
let x = true; 
let y: bool = !x; // 取 反 运算 


let z = x && y; // 远 辑 与 , 带 短路 功能 
printin!("{}", Zz); 


let z=x || y; // 远 辑 或 , 带 短路 功能 
printin!("{}", Zz); 


let z= x&y; // 按 位 与 ,不 带 短 路 功能 
printin!("{}", Zz); 

let z=x | y; // 按 位 或 ,不 带 短路 功能 
printin!("{}", Zz); 

let z= x 人 ^y; // 按 位 异 或 ,不 带 短 路 功能 


printin!("{}", Zz); 


一 些 比较 运算 表达 式 的 类 型 就 是 bool 类 型 : 


fn logical op(x: i32, y: i32) { 
let z : bool = x < y; 
printin!("{}", Zz); 

} 


0 达 式 可 以 用 在 if/while 等 表达 式 中 ， 作 为 条 件 表达 式 。 
比如 : 


if a >= bf 
} else { 


} 


2.2.2 char 


字符 类 型 由 char 表 示 。 它 可 以 搬 述 任何 一 个 符合 unicode 标 准 的 子 
符 值 。 在 代码 中 ， 单 个 的 字符 字面 量 用 单 引号 包围 。 


let love = "| // 可 以 直接 供 入 任何 unicode 字符 


字符 类 型 字面 量 也 可 以 使 用 转 义 符 : 


let c1 = '\n'; // 换行 符 
let c2 = '\x7f',; // 8 bit 字符 变量 
let c3 = 'NXu{f7FFF} // _ unicode 字符 


因为 char 类 型 的 设计 目的 是 描述 任意 一 个 unicode 字 符 ， 因 此 它 占 
据 的 内 存 空间 不 是 1 个 字 节 ， 而 是 4 个 字 闻 。 


对 于 ASCII 字 符 其 实 只 需 占 用 一 个 字 节 的 空间 ， 因 此 Rust 提 供 了 单 
字 和 字符 字面 量 来 表示 ASCII 字 符 。 我 们 可 以 使 用 一 个 字母 b 在 字符 或 
者 字符 串 前 面 ， 代 表 这 个 字面 量 存储 在 u8 类 型 数组 中 ， 这 样 占 用 空间 
比 char 型 数组 要 小 一 些 。 示 例如 下 : 


let x :u8 = 1 

let y :u8 = b'A',; 

let s :&[u8;5] = b"hello"; 

let r :&[u8;14] = br#"hello \n world"#; 


2.2.3 ”整数 类 型 


Rust 有 许多 的 数 子 类 型 ， 主 要 分 为 整数 类 型 和 浮 点 数 类 型 。 本 市 讲 
解 整数 类 型 。 各 种 整 效 类 型 之 间 的 主要 区 分 特征 是 : 有 符号 /无 符号 ， 
占据 空间 大 小 。 具 体 见 表 2-1 。 
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所 谓 有 符号 /无 符号 ， 指 的 是 如 何 理 解 内 存 空间 中 的 bit 表 达 的 舍 
义 。 如 有 果 一 个 变量 是 有 符号 类 型 ， 那 么 它 的 最 高 位 的 那 一 个 bit 束 是 “ 符 
号 位 ?， 表 示 该 数 为 正 值 还 是 负 值 。 如 采 一 个 变量 是 无 符号 类 型 ， 那 么 
它 的 最 高 位 和 其 他 位 一 样 ， 表 示 该 数 的 大 小 。 比 如 对 于 一 个 byte 大 小 
(8 bits) 的 数据 来 说 ， 如 果 存 的 是 无 符号 数 ， 那 么 它 的 表达 范围 是 0 一 
255， 如 采 存 的 是 有 符号 数 ， 那 么 它 的 表达 范围 是 -128 一 127。 


天 于 各 个 整数 类 型 所 占据 的 空间 大 小 ， 在 名 字 中 就 已 经 表现 得 很 
明确 了 ，Rust 原 生 支 持 了 从 8 位 到 128 位 的 整数 。 需 要 特别 关注 的 是 isize 
和 usize 类 型 。 它 们 占据 的 空间 是 不 定 的 ， 与 指针 占据 的 空间 一 人 致 ， 与 
所 在 的 平台 相关 。 如 果 是 32 位 系统 上 ， 则 是 32 位 大 小 ; 如 果 是 64 位 系 
统 上 ， 则 是 64 位 大 小 。 在 C++ 中 与 它们 相对 应 的 类 似 类 型 是 int_ptr 和 
uint_ptr。 Rust 的 这 一 策略 与 C 语 言 不 同 ，C 语 言 标 准 中 对 许多 类 型 的 大 
小 并 没有 做 强制 规定 ， 比 如 int、long、double 等 类 型 ， 在 不 同 平台 上 都 
可 能 是 不 同 的 大 小 ， 这 给 许多 程序 员 带 来 了 不 必要 的 麻烦 。 相 反 ， 在 
语言 标准 中 规定 好 各 个 类 型 的 大 小 ， 让 编译 絮 针 对 不 同 平台 做 适 配 ， 
生成 不 同 的 代码 ， 是 更 合理 的 选择 。 


数字 类 型 的 字面 量 表示 可 以 有 许多 方式 : 


let var1 : i32 = 32; // 十 进 制 表 示 

let var2 : i32 = OxFF; // 以 09x 开 头 代表 十 六 进 制 表示 
let var3 : i32 = Q055; // 以 90o 开 头 代 表 八 进 制 表示 
let var4 : i32 = 0b1001， // 以 09b 开 头 代表 二 进 制 表示 


注意 ! 在 C/C++/JavaScript 语 言 中 以 0 开头 的 数字 代表 八进制 坑 过 不 
少 人 ，Rust 中 设计 不 一 样 。 


在 所 有 的 数字 字面 量 中 ， 可 以 在 任意 地 方 添加 任意 的 下 划 线 ， 以 
方便 阅读 : 


let var5 = 90x_1234_ABCD // 使 


下 划 线 分 割 数字 , 不 影响 语义 , 但 是 极 大 地 提升 了 阅读 体验 。 
“字面 量 后 面 可 以 跟 后 缀 ， 可 代表 该 数字 的 具体 类 型 ， 从 而 省 略 掉 
显示 类 型 标记 : 


let var6 = 123usize,; 
let var7 = Ox_ff_u8; 
let var8 = 32,; 


// i6 变 量 是 Usize 类 型 
// i7 变 量 是 u8 类 型 
// 不 写 类 型 ,默认 为 132 类 型 


在 Rust 中 ， 我 们 可 以 为 任何 一 个 类 型 添加 方法 ， 整 型 也 不 例外 。 比 
如 在 标准 库 中 ， 整 数 类 型 有 一 个 方法 是 pow， 它 可 以 计算 n 次 器 ， 于 赴 
我 们 可 以 这 么 使 用 : 


let x : i32 = 9; 
println!("9 power 3 = {}", x.pow(3)); 


同 理 ， 我 们 甚至 可 以 不 使 用 变量 ， 直 接 对 整 型 字面 量 调用 函数 : 


fn main() { 
println!("9 power 3 = {}", 9_i32.pow(3)); 


我 们 可 以 看 到 这 是 非常 方便 的 设计 。 


对 于 整数 类 型 ， 如 采 Rust 编 译 胡 通过 上 下 文 无 法 分 析出 该 变量 的 具 
体 类 型 ， 则 自动 默认 为 132 类 型 。 比 如 : 


fn main() { 
let x = 10; 
let = 的 


println!("{}", y); 


在 此 例 中 ， 编 译 右 只 知道 x 是 一 个 整数 ， 但 是 具体 是 i8 i16 i32 或 者 
u8 u16 u32 等 ， 并 没有 足够 的 信息 判断 ， 这 些 都 是 有 可 能 的 。 在 这 种 情 
况 下 ， 编 译 器 束 默 认 把 x 当成 132 类 型 处 理 。 这 么 做 的 好 处 是 ， 很 多 时 
候 ， 我 们 不 想 在 每 个 地 方 都 明确 地 指定 数字 类 型 ， 这 么 做 很 麻烦 。 给 
编译 器 指定 一 个 在 信息 不 足 情况 下 的 “ 缺 省 ”类 型 会 更 方便 一 点 。 


2.2.4 ”整数 溢出 


在 整数 的 算术 运算 中 ， 有 一 个 比较 头疼 的 事情 是 “溢出 ”。 在 C 语 言 
中 ， 对 于 无 符号 类 型 ， 算 术 运 算 永 远 不 会 overflow， 如 果 超 过 表示 苞 
围 ， 则 自动 舍弃 高 位 数据 。 对 于 有 符号 类 型 ， 如 果 发 生 了 overflow， 标 
准 规定 这 是 undefined behavior， 世 就 是 说 随便 怎么 处 理 都 可 以 。 


未 定义 行为 有 利于 编译 紫 做 一 些 更 激进 的 性 能 优化 ， 但 是 这 样 的 
规定 有 可 能 导致 在 程序 员 不 知情 的 某 些 极端 场景 下 ， 产 生 诡 异 的 bug。 


Rnust 的 设计 思路 更 倾 癌 于 预防 bug， 而 不 是 无 条 件 地 压榨 效率 ， 
Rnust 设 计 者 希望 能 尽量 减少 “未 定义 行为 ”。 比 如 彻 确 杜绝 “Segment 
Fault” 这 种 内 存 错 误 是 Rust 的 一 个 重要 设计 目标 。 当 然 还 有 其 他 许多 种 
类 的 bug， 即 便 是 无 法 完全 解决 ， 我 们 也 希望 能 尽量 避免 。 整 数 洲 出 就 
是 这 样 的 一 种 bug 。 


Rust 在 这 个 问题 上 选择 的 处 理 方 式 为 : 默认 情况 下 ， 在 debug 模 式 
下 编译 器 会 目 动 揪 入 整数 次 出 检查 ， 一 旦 发 生 海 出 ， 则 会 引发 panic; 
0 不 检查 整数 洲 出 ， 而 是 采用 上 自动 舍弃 高 位 的 方式 。 示 
列 如 下 : 


// 加 法 运算 


fn arithmetic(m: i8, Nn: i8) { 
= 这 中 险 
1 全 山 hy 
printin!("{}", m+ Nn); 


fn main() { 
let m : i8 = 120; 
let n : i8 = 120; 
arithmetic(m, n); 


} 


如 果 我 们 编译 debug 版 本 : 


rustc test.rs 


执行 这 个 程序 ， 结 果 为 : 


thread 'main' panicked at 'attempt to add with overflow', test.rs:3:20 
note: Run with “RUST_BACKTRACE=1 ”for a backtrace. 


可 以 看 到 ， 程 序 执行 时 发 生 了 panic。 有 关 panic 的 详细 解释 ， 需 要 
参见 第 18 章 ， 此 处 无 须 深入 细 方 。 


如 采编 译 一 个 优化 后 的 版 本 ， 加 上 -O 选 项 


rustc -0 test.rs 


执行 时 没有 错误 ， 而 是 使 用 了 目 动 截断 策略 : 


$ ./test 
-16 


Rust 编 译 锅 还 提供 了 一 个 独立 的 编译 开关 供 我 们 使 用 ， 通 过 这 个 开 
关 ， 可 以 设置 溢出 时 的 处 理 策略 : 


$ rustc -C overflow-checks=no test.rs 


“-C overflow-checks=” 可 以 写 “yes” 或 者 “no”"， 打 开 或 者 关闭 洲 出 检 
。 如果 我 们 用 上 面 这 个 命令 编译 ， 执 行 可 见 


$ ./test 
-16 


里 然 它 还 是 debug 版 本 ， 但 我 们 依然 有 办 法 关闭 交 出 检查 。 


如 果 在 某 些 场景 下 ， 用 户 确实 需要 更 精细 地 上 自主 控制 整数 溢出 的 
行为 ， 可 以 调用 标准 库 中 的 checked_*、saturating_* 和 wrapping_* 系 列 


而 数 。 


fn main() { 
let i = 100 i8; 
printlin!("checked {:?}", i.checked add(i)); 
printlin!("saturating {:?}", i.saturating_add(i)); 
printJln!("wrapping {:?}", i.wrapping_add(i)); 

} 


和 输出 结果 为 : 


checked None 
Saturating 127 
wrapping -56 


可 以 看 到 :checked _* 系 列 函 数 返回 的 类 型 是 Option<_ >， 当 出 现 海 
出 的 时 候 ， 返 回 值 是 None;，saturating_* 系 列 范 数 返 回 类 型 是 整数 ， 如 
有 果 浠 出 ， 则 给 出 该 类 型 可 表示 范围 的 “最 大 /最 小 ” 值 ，wrapping_* 系 列 
函数 则 是 直接 抛弃 已 经 湾 出 的 最 高 位 ， 将 剩 下 的 部 分 返回 。 在 对 安全 
性 要 求 非 常 高 的 情况 下 ， 强 烈 建 议 用 户 尽 量 使 用 这 几 个 方法 替代 默认 
的 算术 运算 符 来 做 数学 运算 ， 这 样 表意 更 清晰 。 在 Rust 标 准 库 中 就 大 量 
使 用 了 这 几 个 方法 ， 而 不 是 简单 地 使 用 算术 运算 符 ， 值 得 大 家 参考 。 


在 很 多 情况 下 ， 整 数 溢 出 应 该 被 处 理 为 截断 ， 即 丢弃 最 高 位 。 为 
了 方便 用 户 ， 标 准 库 还 提供 了 一 个 叫 作 std: : num: : Wrapping<T> 的 
类 型 。 它 重 载 了 基本 的 运算 符 ， 可 以 被 当成 普通 整数 使 用 。 凡 是 被 它 
人 任何 时 候 出 现 次 出 都 是 截断 行为 。 篆 见 使 用 示例 如 


use std::num: :Wrapping; 


fn main() { 
let big = Wrapping(std::u32::MAX); 
let sum = big + Wrapping(2_u32); 
printin!("{}", sum.0); 

} 


不 论 用 什么 编译 选项 ， 上 述 代 码 部 不 会 触发 panic， 任 何 情况 下 执 
行 结案 都 是 一 致 的 。 


标准 库 中 还 提供 了 许多 有 用 的 方法 ， 在 此 不 一 一 敬 述 ， 请 大 家 人 参 
考 标准 API 文 档 。 


2.2.5 浮 点 类 型 
Rust 提 供 了 基于 IEEE 754-2008 标 准 的 浮 点 类 型 。 按 占据 空间 大 小 


区 分 ,分 别 为 fB2 和 f64， 其 使 用 方法 与 整 型 差别 不 大 。 浮 点 数 子 面 量 表 
示 方 式 有 如 下 几 种 : 


let f1 = 123.0f64; // type f64 
let f2 = 0.1f64; // type f64 
let f3 = 0.1f32,; // type f32 
let f4 = 12E+99_f64; // type f64 科学 计数 法 
let f5 : f64 = 2,， // type f64 


与 整 效 类 型 相 比 ，Rust 的 译 点 数 类 型 相对 复杂 得 多 。 浮 点 数 的 碎 烦 
之 处 在 于 : 它 不 仅 可 以 才 达 正 各 的 数值 ， 还 可 以 表达 不 正 利 的 数值 。 


在 标准 库 中 ， 有 一 个 std: : num: : FpCategory 枚 举 ， 表 示 了 浮 点 
数 可 能 的 状态 : 


enum FpCategory { 
Nan, 
Infinite, 
Zero, 
Subnormal, 
Normal, 


} 


其 中 Zero 表 示 0 值 、Normal 表 示 正 常 状态 的 浮 点 数 。 其 他 几 个 就 需 
要 特别 解释 一 下 了 。 


在 IEEE 754 标 准 中 ， 规 定 了 浮 点 数 的 二 进 制 表达 方式 : x= (-1) 
As* (1+M) *2Ae。 其 中 s 是 符号 位 ，M 是 尾数 ，e 是 指数 。 尾 数 M 是 一 个 
[0，1) 范围 内 的 二 进 制 表示 的 小 数 。 以 32 位 浮 点 为 例 ， 如 果 只 有 
normal 形 式 的 话 ，0 表 示 为 所 有 位 数 全 0， 则 最 小 的 非 零 正 数 将 是 尾数 最 
后 一 位 为 1 的 数字 ， 就 是 (1+2^ (-23) ) *2A (-127) ， 而 次 小 的 数字 
为 〈1+2A (-22) ) *2A (-127) ， 这 两 个 数字 的 差距 为 2A 〈-23) *2A^ 

(-127) =2^ (-150) ， 然 而 最 小 的 数字 和 0 之 间 的 差距 有 (1+2^ 


(-23) ) *2^A (-127) ， 约 等 于 2^ (-127) ， 也 就 是 说 ， 数 字 在 渐渐 减 
少 到 0 的 过 程 中 突然 降 到 了 0。 为 了 减少 0 与 最 小 数字 和 最 小 数字 与 次 小 
数字 之 间 步 长 的 突然 下 跌 ，subnormal 规 定 : 当 指 数位 全 0 的 时 候 ， 指 数 
表示 为 -126 而 不 是 -127 《和 指数 为 最 低位 为 1 一 致 ) 。 然 而 公式 改 成 

(-1) As*M*#2Ae，M 不 再 +1， 这 样 最 小 的 数字 就 变 成 2^ 〈-23) *#2^ 

(-126) ， 次 小 的 数字 变 成 2A (-22) *2^ (-126) ， 每 两 个 相 邻 
subnormal 数 字 之 差 都 是 2^ (-23) *2^ (-126) ， 避 免 了 突然 降 到 0。 在 
这 种 状态 下 ， 这 个 浮 点 数 束 处 于 了 Subnormal 状 态 ， 处 于 这 种 状态 下 的 
浮 点 数 表示 精度 比 Normal 状 态 下 的 精度 低 一 点 。 我 们 用 一 个 示例 来 演 
示 一 下 什么 是 Subnormal 状 态 的 浮 点 数 : 


fn main() 
// 变量 small 初始 化 为 一 个 非常 小 的 浮 点 数 
let mut small = std::f32::EPSILON; 
// 不 断 循环 ,让 small 越 来 越 趋 近 于 9, 直到 最 后 等 于 9 的 状态 
while small > 0.0 { 
small = small / 2.0; 
printin!("{} {:?}", small, small.classify()); 


编译 ， 执 行 ， 发 现 循环 几 十 次 之 后 ， 数 值 束 小 到 了 无 法 在 32bit 泥 
围 内 合理 表达 的 程度 ， 最 终 收 敛 到 了 0， 在 后 面 表示 非常 小 的 数值 的 时 
候 ， 浮 点 数 束 已 经 进入 了 Subnormal 状 态 。 


Infinite 和 Nan 是 带 来 更 多 麻烦 的 特殊 状态 。 Ifinite 代 表 的 是 “无 穷 
大 ”，Nan 代 表 的 是 “不 是 数字 ” (not anumber) 。 


什么 情况 会 产生 “无 穷 大 ”和 “不 古 数 子 ” 呢 ?举例 说 明 : 


fn main() { 
let x = 1.0f32 / 0.0; 
let y = 0.0f32 / 0.0; 
println!("{} {}", x, y); 
} 


编译 执行 ， 打 印 出 来 的 结果 分 别 为 inf NaN。 非 0 数 除 以 0 值 ， 得 到 
的 是 inf，0 除 以 0 得 到 的 是 NaN 。 


对 inf 做 一 些 数 学 运算 的 时 候 ， 它 的 结果 可 能 与 你 期 望 的 不 一 致 


fn main() { 
let inf = std::f32::INFINITY; 
printlnl("{} {€} ©", inf * 0.0, 1.0 / inf, inf / inf); 


编译 执行 ， 结 果 为 : 


NaN 0 NaN 


NaN 这 个 特殊 值 有 个 特殊 的 麻烦 ， 主 要 问题 还 在 于 它 不 具备 “全 
序 ” 的 特点 。 示 例如 下 : 


fn main() { 
let nan = std::f32::NAN; 
printin!("{} {} 人 0}", nan < nan, nan > nan, nan == nan); 


编译 执行 ， 输 出 结果 为 : 


false false false 


这 职 很 麻烦 了 ， 一 个 数字 可 以 不 等 于 目 己 。 因 为 NaN 的 存在 ， 浮 
点 数 是 不 具备 “全 序 关 系 ” (total order) 的 。 关 于 “全 序 ? 和 “ 偏 序 ”的 问 
题 ， 本 厄 就 不 展开 讲解 了 ， 后 面 讲 到 trait 的 时 候 ， 再 给 大 家 介绍 
PartialOrd 和 和 Ord 这 两 个 trait 。 


2.2.6 指针 类 型 

无 GC 的 编程 语言 ， 如 C、C++ 以 及 Rust， 对 数据 的 组 织 控 作 有 更 多 
的 自由 度 ， 具 体 表现 为 : 

-同一 个 类 型 ， 某 些 时 候 可 以 指定 它 在 栈 上 ， 某 些 时 候 可 以 指定 它 
在 堆 上 。 内 存 分 配方 式 可 以 取决 于 使 用 方式 ， 与 类 型 本 身 无 关 。 

: 既 可 以 直接 访问 数据 ， 也 可 以 通过 指针 间接 访问 数据 。 可 以 针对 
任何 一 个 对 象 取得 指向 它 的 指针 。 


- 既 可 以 在 复合 数据 类 型 中 直接 拘 入 别 的 类 型 的 实体 ， 也 可 以 使 用 
指针 ， 间 接 指向 别 的 类 型 。 

"甚至 可 能 在 复合 数据 类 型 末尾 嵌入 不 定 长 数据 构造 出 不 定 长 的 复 
合 数据 类 型 。 

Rust 里 面 也 有 指针 类 型 ， 而 且 不 止 一 种 指针 类 型 。 常 见 的 几 种 指针 
类 型 见 表 2-2。 


表 于 2 


类 型 名 简介 
Box<T> 指向 类 型 TT 的、 具有 所 有 权 的 指 , 有 权 释 放 内 存 

指向 类 型 T 的 借用 指针 ， 也 称 为 引用 ,无 权 释放 内 存 ， 无 权 写 数据 
指向 类 型 工 的 mut 型 借用 指针 ， 无 权 释放 内 存 ， 有 权 写 数据 
指向 类 型 T 的 只 读 裸 指针 ， 没 有 生命 周期 信息 ， 无 权 写 数据 

指向 类 型 T 的 可 读 写 裸 指 针 ， 没 有 生命 周期 信息 ， 有 权 写 数据 


&T 
&mut T 
*const T 


*mut T 


除 此 之 外 ， 在 标准 库 中 还 有 一 种 封装 起 来 的 可 以 当 作 指针 使 用 的 
类 型 ， 叫 “智能 指针 ” (smart pointer) 。 常 见 的 智能 指针 见 表 2-3。 
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类 型 名 简介 
Rc<T> 指向 类 型 T 的 引用 计数 指针 ， 共 享 所 人 线程 不 安全 
Arc<T> 指向 类 型 T 的 原子 型 引用 计数 指针 ， 共 享 所 有 权 ， 线 程 安全 
Cow<’a, T> Clone-on-write， 写 时 复制 指针 。 可 能 是 是 "人 用 指针 ， 也 可 能 是 具有 所 有 权 的 指针 


有 关 这 几 种 指针 的 使 用 方法 和 设计 原理 ， 请 参见 本 书 第 二 部 分 。 


2.2.7 ”类 型 转换 


Rust 对 不 同类 型 之 间 的 转换 控制 得 非常 严格 。 即 便 是 下 面 这 样 的 程 
序 ， 也 会 出 现 编译 错误 : 


fn main() { 
let var1 : i8 = 41; 
let var2 : i16 = vari,; 


编译 结果 为 mismatched types! i8 类 型 的 变量 竟然 无 法 向 i16 类 型 的 
变量 赋值 ! 这 可 能 对 很 多 用 户 来 说 都 是 一 个 意外 。 


Rust 提 供 了 一 个 关键 字 as， 专 门 用 于 这 样 的 类 型 转换 : 


fn main() { 
let var1 : i8 = 41; 
let var2 : i16 = vari1 as i16; 
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也 就 是 说 ，Rust 设 计 者 希望 在 发 生 类 型 转换 的 时 候 不 是 偷偷 摸 摸 进 
行 的 ， 而 是 显 式 地 标记 出 来 ， 防 止 隐藏 的 bug。 虽然 在 许多 时 候 会 让 代 
码 显得 不 那么 精简 ， 但 这 也 算是 一 种 合理 的 折 中 。 


as 天 键 字 也 不 是 随便 可 以 用 的 ， 它 只 允许 编译 器 认为 合理 的 类 型 转 
换 。 任 意 类 型 转换 是 不 允许 的 : 


let a = "some string"; 
let b = a as u32; // 编译 错误 


有 些 时 候 ， 其 至 需要 连续 写 多 个 as 才 能 转 成 功 ， 比 如 &i32 类 型 就 
不 能 直接 转换 为 *mut i32 类 型 ， 必 须 像 下 面 这 样 写 才 可 以 : 


fn main() { 
let i = 42; 
// 先 转 为 *const i32, 再 转 为 *mut i32 
let p = &i as *const i32 as *mut i32; 
println!("{:p}", p); 


as 表达 式 允 许 的 类 型 转换 如 表 2-4 所 示 。 对 于 表达 式 e as U，e 是 表 
达 式 ，U 是 要 转换 的 目标 类 型 ， 表 2-4 中 所 示 的 类 型 转换 是 允许 的 。 


| 


Type of e 

Integer of Float type 
C-like enum 

bool or char 

u8 

dk 

*T where T: Sized 
Integer type 

&[T; n] 

Function pointer 


Function pointer 


U 

Integer or Float type 
Integer type 

Integer type 

char 

*V WhereV: Sized* 
Numeric type 

*Vwhere V: Sized 
*const T 

*V where V: Sized 


Integer 


如 果 需 要 更 复杂 的 类 型 转换 ， 一 般 是 使 用 标准 库 的 From Into 等 


trait， 请 参见 第 26 章 。 


复合 数据 类 型 可 以 在 其 他 类 型 的 基础 上 形成 更 复杂 的 组 合 天 系 。 
本 章 介 绍 tuple、struct、enum 等 几 种 复合 数据 类 型 。 数 组 留 到 第 6 
思 


2.3.1 tuple 


tuple 指 的 是 “元 组 类型， 它 通 过 圆 括号 包含 一 组 表达 式 构成 。 
和 名 字 。tuple 是 把 儿 个 类 型 组 合 到 一 起 的 最 简单 的 方 
工 W 0D: 


let a = (1i32, false); // 元 组 中 包含 两 个 元 素 , 第 一 个 是 i32 类 型 ,第 二 个 是 bo01 类 
型 

let b = ("a", (1i32, 2i32)); // 元 组 中 包含 两 个 元 素 , 第 二 个 元 素 本 身 也 是 元 组 , 它 又 包含 
了 两 个 元 素 


如 有 条 元 组 中 只 包含 一 个 元 素 ， 应 该 在 后 面 添加 一 个 逗号 ， 以 区 分 
括号 表达 式 和 元 组 : 


(0, ); // a 是 一 个 元 组 , 它 有 一 个 元 素 
(0); // b 是 一 个 括号 表达 式 , 它 是 132 类 型 


let a 
let b 


访问 元 组 内 部 元 素 有 两 种 方法 ， 一 种 是 “模式 匹配 ” (pattern 
destructuring) ， 另 外 一 种 是 “数字 索引 ”: 


let p = (1i32, 2i32); 
let (a, b)= p; 


let x = p.0; 
let = p.1; 
println!("{} {} {} {}", a, b, x, y); 


在 第 7 章 中 会 对 “模式 匹配 ”做 详细 解释 。 


元 组 内 部 也 可 以 一 个 元 素 都 没有 。 这 个 类 型 单独 有 一 个 名 字 ， 叫 
unit 〈 单 元 类 型 ) : 


let empty : () = (); 


可 以 说 ，unit 类 型 是 Rust 中 最 简单 的 类 型 之 一 ， 也 是 占用 空间 最 小 
的 类 型 之 一 。 空 元 组 和 空 结构 体 stmct Foo; 一 样 ， 都 是 占用 0 内 存 空 
间 。 


fn main() { 
println!("size of i8 {}" , std::mem::size of::<i8>()); 
printin!("size of char {}" , std::mem::size of::<char>()); 
printin!("size of '()' {}" , std::mem::size of::<()>()); 


上 面 的 程序 中 ，std: : mem: : size_of 函 数 可 以 计算 一 个 类 型 所 
占用 的 内 存 空 间 。 可 以 看 到 ，i8 类 型 占用 1 byte，char 类 型 占用 4 bytes， 
空 元 组 占用 0 byte 。 


与 C++ 中 的 空 类 型 不 同 ，Rust 中 存在 实打实 的 0 大 小 的 类 型 。 在 
C++ 标准 中 ， 有 了 明确 的 规定 ， 十 这 么 说 的 : 


Complete objects and member subobjects of class type shall have 
nonzero size. 


class Empty {}; 
Empty emp; 
assert(sizeof(emp) != 0); 


2.3.2 struct 


结构 体 (struct) 与 元 组 类 似 ， 也 可 以 把 多 个 类 型 组 合 到 一 起 ， 作 
为 新 的 类 型 。 区 别 在 于 ， 它 的 每 个 元 素 都 有 自己 的 名 字 。 举 个 例子 : 


struct Point { 
Xi 132; 
y: i32, 

} 


每 个 元 素 之 间 采 用 逗号 分 开 ， 最 后 一 个 逗号 可 以 省 略 不 写 。 类 型 

依旧 跟 在 冒号 后 面 ， 但 是 不 能 使 用 自动 类 型 推导 功能 ， 必 须 显 式 指 

定 、stuct 美 型 的 初始 化 语法 类似 于 json 的 语法 ， 使 用 "成 员 -冒号 - 值 "的 
式 。 


fn main() { 
let p = Point { x: 0, y: 0}; 
printin!("Point is at {} {}", p.x, p.y); 


有 些 时 候 ，Rust 人 允许 struct 类 型 的 初始 化 使 用 一 种 简化 的 写法 。 如 
人 名 字 和 成 员 变 量 名 字 恰 好 一 致 ， 那 么 可 以 省 略 醒 重 复 的 
冒号 初始 化 : 


fn main() 全 


// 刚好 局 部 变量 名 字 和 结构 体 成 员 名 字 一 致 

let x = 10; 

let y = 20; 

// 下 面 是 简略 写法 , 等 同 于 Point { Xx: x，y: y }》, 同 名 字 的 相对 应 


let p = Point { X， y }; 
printlin!("Point is {} {}", p.x, p.y); 


访问 结构 体内 部 的 元 素 ， 也 是 使 用 “点 ?加 变量 名 的 方式 。 当然 ， 
我 们 也 可 以 使 用 “模式 匹配 ”功能 


fn main() { 
let p = Point { x: 0}; 
// 声明 了 px 和 py, 分 另 如 闫 到 成 x 和 成 员 y 
let Point { x : px, y : py } = p; 
printin!("Point is at {} {€}", px, py); 
// ee 新 的 变量 名 出 和 成 员 名 字 相同 ， 可 以 使 用 简写 方式 
let Point { X， 
Br bo is a Pe {}", x, y); 


Rust 设 计 了 一 个 语法 糖 ， 人 允许 用 一 种 简化 的 语法 赋值 使 用 另外 一 个 
struct 的 部 分 成 员 。 比 如 : 


struct Point3d { 
x: i32, 
y: i32, 


Z: i32, 
} 


fn default() -> Point3d { 
Point3d { x: 0, y: 0, z: 0 } 
} 


// 可 以 使 用 default( ) 画 数 初始 化 其 他 的 元 素 
// ..expr 这 样 的 语法 , 只 能 放 在 初始 化 表达 式 中 , 所 有 成 员 的 最 后 最 多 只 能 有 一 个 
let origin = Point3d { x: 5, ..default()}; 

let point = Point3d { z: 1, x: 2, ..origin }; 


如 前 所 说 ， 与 tuple 类 似 ，struct 内 部 成 员 也 可 以 古 空 : 


// 以 下 三 种 都 可 以 , 内 部 可 以 没有 成 员 
struct Foo1， 

Struct Foo2(); 

struct Foo3{} 


2.3.3 tuple struct 


Rust 有 一 种 数据 类 型 叫 作 tuple struct， 它 就 像 是 tuple 和 struct 的 混 
合 。 区 别 在 于 ，tuple struct 有 名 字 ， 而 它们 的 成 员 没 有 名 字 : 


struct Color(i32, i32, i32); 
struct Point(i32, i32, i32); 


它们 可 以 被 想象 成 这 样 的 结构 体 : 


struct Colorf{ 
0: i32, 
1 .32 
2: i32, 
struct Point { 
0: i32, 
1: i32, 
2 32; 


因为 这 两 个 类 型 都 有 目 己 的 名 字 ， 虽 然 它 们 的 内 部 结构 是 一 样 
的 ， 但 是 它们 是 完全 不 同 的 两 个 类 型 。 有 时 候 我 们 不 需要 特别 关心 结 
构 体 内 部 成 员 的 名 字 ， 可 以 采用 这 种 语法 。 


tuple、struct、struct tuple 起 的 作用 都 是 把 几 个 不 同类 型 的 成 员 打包 
组 合成 一 个 类 型 。 它 们 的 区 别 如 表 2-5 所 示 。 


表 2-5 
类 型 名 称 tuple struct 


语法 没 名 字 圆 括号 名 字 加 大 括号 名 字 加 圆 括号 
类 型 名 字 没有 单独 的 名 字 有 单独 的 名 字 有 单独 的 名 字 
成 员 名 字 没有 单独 的 名 字 有 单独 的 名 字 没 单独 的 名 字 


它们 除了 在 取 名 上 有 这 些 区 别 外 ， 没 有 其 他 区 别 。 它 们 有 一 致 的 
内 存 对 齐全 略 、 一 致 的 占用 空间 规则 ， 也 有 类 似 的 语法 。 从 下 面 这 个 
例子 可 以 看 出 它们 的 语法 是 很 一 致 的 : 


// define struct 
struct T1 { 
VvV: i32 


} 
// define tuple struct 
struct T2(i32); 


fn main() { 


let vi = Ti {v: 1}; 

let v2 = T2(1); // init tuple struct 
let v3 = T2 {0: 1}; // init tuple struct 
let i1 = vi.v; 

let i2 = v2.0; 

let i3 = v3.0; 


tuple struct 有 一 个 特别 有 用 的 场景 ， 那 就 是 当 它 只 包 仿 一 个 元 素 的 
时 候 ， 就 是 所 谓 的 newtype idiom。 因 为 它 实际 上 让 我 们 非常 方便 地 在 
一 个 类 型 的 基础 上 创建 了 一 个 新 的 类 型 。 举 例如 下 : 


fn main() { 
struct Inches(i32); 


fn fi(value : Inches) 人 
fn f2(value : i32) 全 


let v : i32 = 0; 
fi(v); // 编译 不 通过 , 'mismatched types' 
f2(v); 


以 上 程序 编译 不 通过 ， 因 为 Inches 类 型 和 i32 是 不 同 的 类 型 ， 画 数 
调用 参数 不 匹配 。 


但 是 ， 如 果 我 们 把 以 上 程序 改 一 下 ， 使 用 type alias (类 型 别名 ) 实 
现 ， 那 么 就 可 以 编译 通过 了 了 : 


fn type_alias() { 
type I = i32; 


fn fi(v : I) {} 
fn f2(v : i32) 人 
let v : i32 = 0; 


f1i(v); 
f2(v); 


从 上 面 的 讲解 可 以 看 出 ， 通 过 关键 字 type， 我 们 可 以 创建 一 个 新 的 
类 型 名 称 ， 但 是 这 个 类 型 不 是 全 新 的 类 型 ， 而 只 是 一 个 具体 类 型 的 别 
名 。 在 编译 器 看 来 ， 这 个 别名 与 原先 的 具体 类 型 是 一 模 一 样 的 。 而 使 
用 tuple struct 做 包装 ， 则 是 创造 了 一 个 全 新 的 美 型 ， 它 跟 被 包装 的 类 型 
不 能 发 生 隐 式 类 型 转换 ， 可 以 具有 不 同 的 方法 ， 满 足 不 同 的 tait， 完 全 
按 需 而 定 。 


2.3.4 enum 


如 果 说 tuple、struct、tuple struct 在 Rust 中 代表 的 是 多 个 类 型 
的 “与 天 系 ， 那 么 enum 类 型 在 Rust 中 代表 的 就 是 多 个 类 型 的 “或 "关系 。 


与 C/C++ 中 的 枚 举 相 比 ，Rust 中 的 enum 要 强大 得 多 ， 它 可 以 为 每 个 
成 员 指 定 附 属 的 类 型 信息 。 比 如 说 我 们 可 以 定义 这 样 的 类 型 ， 它 内 部 
可 能 是 一 个 132 型 整数 ， 或 者 是 f32 型 浮 点 数 : 


enum Number { 
Int(i32)， 
Float(f32), 


Rust 的 enum 中 的 每 个 元 妈 的 定义 语法 与 struct 的 定义 语法 类 似 。 可 
以 像 空 结 构 体 一 样 ， 不 指定 它 的 类 型 ， 也 可 以 像 tuple struct 一 样 ， 用 圆 


括号 加 无 名 成 员 ， 还 可 以 像 正 常 结构 体 一 样 ， 用 大 括号 加 带 名 字 的 成 
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用 enum 把 这 些 类 型 包含 到 一 起 之 后 ， 就 组 成 了 一 个 新 的 类 型 。 


要 使 用 enum， 一 般 要 用 到 “模式 匹配 ”。 模 式 匹 配 是 很 重要 的 一 部 
分 ， 用 第 7 章 来 详细 讲解 。 这 里 我 们 给 出 一 个 用 match 语 句 读 取 enum 内 
部 数据 的 示例 : 


enum Number { 
Int(i32)， 
Float(f32), 
} 


fn read num(num: &Number) { 
match num { 
// 如 果 匹 配 到 了 Number : :Int 这 个 成 员 , 那么 value 的 类 型 就 是 i32 
&Number::InNt(value) => printin!("Integer {}", value 
// 如 果 匹 配 到 了 Number: :Float 这 个 成 员 , 那么 value 的 类 型 就 是 f32 
&Number: :Float(value) => println!("Float {}", value), 


), 


} 


} 
fn main() { 


let n: Number = Number::Int(10); 
read_num(&n); 


Rust 的 enum 与 CU/C++ 的 enum 和 union 都 不 一 样 。 它 是 一 种 更 安全 的 
类 型 ， 可 以 被 称 为 tagged union”。 从 C 语 言 的 视角 来 看 Rust 的 enum 类 
型 ， 重 写 上 面 这 上段 代码 ， 它 的 语义 类 似 这 样 : 


#include <stdio.h> 
#include <stdint.h> 


// C 语言 模拟 Rust 的 enum 
struct Number { 
enum {Int, Float} tag; 
union { 
int32_t int_value,; 
float float_value,; 
} value,; 


¥ 


void read num(struct Number * num) { 
switch(num->tag) { 
case Int: 
printf("Integer %d", num->value.int_value); 
break; 
case Float: 


printf("Float %f", num->value.float_value); 
break; 


default: 
printf("data error"); 
break; 
} 
3 


int main() { 
struct Number n = { tag : Int, value: { int_value: 10} }; 
read_num(&n); 
return 0; 


Rust 的 enum 类 型 的 变量 需要 区 分 它 里 面 的 数据 究竟 是 哪 种 变 体 ， 
所 以 它 包 含 了 一 个 内 部 的 “tag 标 记 ” 来 描述 当前 变量 属于 哪 种 类 型 。 这 
个 标记 对 用 户 是 不 可 见 的 ， 通 过 恰当 的 语法 设计 ， 保 证 标记 与 类 型 始 
终 是 匹配 的 ， 以 防止 用 户 错 误 地 使 用 内 部 数据 。 如 果 我 们 用 C 语 言 来 模 
拟 ， 就 需要 程序 员 自 己 来 保证 读 写 的 时 候 标记 和 数据 类 型 是 匹配 的 ， 
编译 属 无 法 目 动 检 查 。 当 然 ， 上 面 这 个 模拟 只 是 为 了 通俗 地 解释 Rust 的 
enum 类 型 的 基本 工作 原理 ， 在 实际 中 ，enum 的 内 存 布 局 未 必 是 这 个 样 
子 ， 编 译 器 有 许多 优化 ， 可 以 保证 语义 正确 的 同时 减少 内 存 使 用 ， 并 
加 快 执行 速度 。 如 果 是 在 FFI 场 景 下 ， 要 保证 Rust 里 面 的 enum 的 内 存 布 
局 和 C 语 言 兼容 的 话 ， 可 以 给 这 个 enum 添 加 一 个 #[repr (C，Int) ] 属 性 
标签 (目前 这 个 设计 已 经 通过 ,但 是 还 未 在 编译 器 中 实现 ) 。 


我 们 可 以 试 着 把 前 面 定义 的 Number 类 型 占用 的 内 存 空 间 大 小 打印 
出 来 看 看 : 


fn main() { 
// 使 用 了 泛 型 画 数 的 调用 语法 ,请 参考 第 21 章 泛 型 
printin!("Size of Number: {}", std::mem::size of::<Number>()); 


printJln!("Size of i32: {}", std::mem::size of::<i32>()); 

printilin!("Size of f32: {}", std::mem::size of::<f32>()); 
} 

Nsra 一 
编译 执行 可 见 : 

Size of Number: 8 
Size of i32: 4 
Size of f32: 4 


Number 里 面 要 么 存储 的 是 i32， 要 么 存储 的 是 f32， 它 存储 数据 需 
要 的 空间 应 该 是 max (sizeof (i32) ，sizeof (f32) ) =max (4byte, 4 


byte) =4 byte。 而 它 总 共 占 用 的 内 存 是 8 byte， 多 出 来 的 4 byte 就 是 用 于 
保存 类 型 标记 的 。 之 所 以 用 4byte， 是 为 了 内 存 对 齐 。 


Rust 里 面 也 支持 union 类 型 ， 这 个 类 型 与 C 语 言 中 的 union 完 全 一 
致 。 但 在 Rust 里 面 ， 读 取 te 一 般 情 议 下 
这 种 类 型 。 它 存在 的 主要 目的 是 为 了 方便 与 C 语 言 进行 交 


在 Rust 中 ，enum 和 和 struct 为 内 部 成 员 创建 了 新 的 名 字 空 间 。 如 果 要 
访问 内 部 成 员 ， 可 以 使 用 : : 符号 。 因 此 ， 不同 的 enum 中 重 名 的 元 素 
也 不 会 互相 冲突 。 例 如 在 下 面 的 程序 中 ， 两 个 枚 举 内 部 都 有 Move 这 个 
成 员 , 但 是 它们 不 会 有 冲突 。 


enum Message { 
Quit, 
ChangeColor(i32, i32, i32), 
Move { x: i32, y: i32 + 
write(String), 


} 
let x: Message = Message::Move { XxX: 3, y: 4 }; 
enum BoardGameTurn { 

Move { squares: i32 }, 


Pass, 


let y: BoardGameTurn = BoardGameTurn::Move { squares: 1 }; 


我 们 也 可 以 手动 指定 每 个 变 体 目 己 的 标记 值 : 


fn main() { 
enum Animal { 


dog = 1, 
cat = 200, 
tiger, 


} 
let x = Animal::tiger as isize,; 
printin!("{}", x); 


Rust 标 准 库 中 有 一 个 极其 常用 的 enum 类 型 Option<T>， 它 的 定义 如 
下 : 


enum Option<T> { 
None 


Some(T), 


由 于 它 实在 是 太 党 用， 标准 库 将 Option 以 及 它 的 成 员 Some、None 
都 加 入 到 了 Prelude 中 ， 用 户 甚 至 不 需要 use 语 句 声 明 就 可 以 直接 使 用 。 
它 表 示 的 合 义 是 “要 么 存在 、 要 么 不 存在 ”。 比 如 Option<i32> 表 达 的 意 
思 束 是 “可 以 是 一 个 132 类 型 的 值 ， 或 者 没有 任何 值 ”。 


Rust 的 enum 实 际 上 是 一 种 代数 类 型 系统 (Algebraic Data Type， 
ADT) ， 本 书 第 8 章 简 要 介绍 什么 是 ADT。enum 内 部 的 variant 只 证 一个 
名 字 而 已 ， 恰好 我 们 还 可 以 将 这 个 名 学 作为 类 型 和 造 嚣 使用。 意思 是 
说 ， 我 们 可 以 把 enum 内 部 的 variant 当 成 一 个 函数 使 用 ， 示 例如 下 : 


fn main() { 
let arr = [1,2,3,4,5]; 
// 请 注意 这 里 的 map 函 数 
let v: Vec<0Option<&i32>> = arr.iter().map(Some).collect(); 
printin!("{:?}", VvV); 


有 关 迭 代 器 的 知识 ， 请 各 位 读者 参考 第 24 章 的 内 容 。 在 这 里 想 说 
Some 可 以 当成 范 数 作为 参数 传递 给 map。 这 里 的 Some 其 
是 作为 一 个 芳 数 来 使 用 的 ， 它 答 入 的 十 &i32 类 型 ， 输 出 为 
0 ° 可 以 用 如 下 方式 证 明 Some 人 确实 是 一 个 函数 类 型 ， 
我 们 把 Some 初 始 化 给 一 个 unit 变 量 ， 产 生 一 个 编译 错误 : 


fn main() { 
let _ : () = Some; 
} 


编译 锯 误 十 这 样 写 的 : 


error[E0308]: mismatched types 
--> test.rs:3:18 
| 
3 | let _ : () = Some; 
| AAAA expected (), found fn item 
| 


note: expected type ‘(). 
found type ‘fn(_) -> std::option::0Option< > 
{std: :option: :Option< >::Some}. 


可 见 ，enum 内 部 的 variant 的 类 型 确实 是 函数 类 型 。 
2.3.5 ”类型 递归 定义 


Rust 里 面 的 复合 数据 类 型 是 允许 递归 定义 的 。 比 如 struct 里 面 舱 套 
同样 的 struct 类 型 ， 但 是 直接 骸 套 是 不 行 的 。 示 例如 下 : 


struct Recursive { 
data: i32, 
rec: Recursive, 


} 


使 用 rustc--crate-type=lib test.rs 命 令 编译 ， 可 以 看 到 如 下 编译 错误 : 


error[E0072]: recursive type ‘Recursive. has infinite size 
--> test.rs:2:1 


| 
2 | struct Recursive { 

| AAAAAAAAAAAAAAAA recursive type has infinite size 
3 | data: i32, 
4 | rec: Recursive, 

| 


-------------- recursive without Indirection 


= help: insert indirection (e.g., a Box ， ‘Rc', or ‘&) at some point to make 
Recursive representable 


ee 不 仅 写 清楚 了 错误 原 因 ， 
能 的 修复 办 法 。 ee ee i 
二 型 递归 定义 的 问题 在 于 ， 当 编译 器 计算 Recursive 这 个 美 型 大 小 的 
时 候 : 


size_of::<Recursive>() == 4 + size_of::<Recursive>() 


这 个 方程 在 实数 范围 内 无 解 。 


解决 办 法 很 简单 ， 用 指针 间接 引用 可 可 以 了 ， 因 为 指针 的 天 小 二 
固定 的 ， 比 如 ; 


struct Recursive { 
data: i32, 


rec: Box<Recursive>, 


Be 0 这 个 类 型 就 非常 
合理 了 。 


第 3 革 语句 和 表达 式 


语句 和 表达 式 是 Rust 语 言 实 现 控制 逻辑 的 基本 单元 。 


3.1 语句 


一 个 Rust 程 序 ， 是 从 main 函 数 开始 执行 的 。 而 函数 体内 ， 则 是 由 
一 条 条 语句 组 成 的 。 


Rnust 程 序 里 ， 表 达 式 (Expression) 和 语句 (Statement) 是 完成 流 
程控 制 、 计 算 求 值 的 主要 工具 ， 也 是 本 节 要 讲 的 核心 部 分 。 在 Rust 程 
序 里 面 ， 表 达 式 可 以 是 语句 的 一 部 分 ， 反 过 来 ， 语 名 也 可 以 是 表达 式 
的 一 部 分 。 一 个 表达 式 总 是 会 产生 一 个 值 ， 因 此 它 必然 有 类 型 ， 语 句 
不 产生 值 ， 它 的 类 型 永远 是 () 。 如 果 把 一 个 表达 式 加 上 分 号 ， 那 么 
它 就 变 成 了 一 个 语句 ;如 果 把 语句 放 到 一 个 语句 块 中 包 起 来 ， 那 么 它 
就 可 以 被 当成 一 个 表达 式 使 用 。 


32 雪 达 去 


在 Rust Reference 中 有 这 样 一 句 话 : 
Rust is primarily an expression language. 


Rust 基 本 上 就 古 一 个 表达 式 语言 。“ 表 达 式 ”在 Rust 程 序 中 占据 着 
重要 位 置 ， 表 达 式 的 功能 非常 强大 。Rust 中 的 表达 式 语法 具有 非 第 好 
的 “一 致 性 "， 每 种 表达 式 都 可 以 坐 入 到 另外 一 种 表达 式 中 ， 组 成 更 强 
HIT Ty 


Rust 的 表达 式 包 括 字 面 量 表达 式 、 方 法 调用 表达 式 、 数 组 表达 
式 、 索 引 表达 式 、 单 目 运 算 符 表达 式 、 双 目 运算 符 表 达 式 等 。Rnust 表 
达 式 又 可 以 分 为 “ 左 值 ”(lvalue) 和 “ 右 值 ” (rvalue) 两 类 。 上 所 谓 左 
值 ， 意 思 是 这 个 表达 式 可 以 表达 一 个 内 存 地 址 。 因 此 ， 它 们 可 以 放 到 
赋值 运算 符 左 边 使 用 。 其 他 的 都 是 右 值 。 


321 运 意 表达 元 


Rust 的 算术 运算 符 包括 : 加 (+) 、 减 (-) 、 乘 (*) 、 除 WV) 、 
求 余 〈%) ， 示 例如 下 : 


fn main() { 
let x = 100; 


let y = 10; 
printlin!("{} {} {XxX+Yy, xy xy XxX/y, x% y); 


在 上 面 例 于 中 ，x+y、x-y 这 些 都 是 算术 运算 表达 式 ， 它 们 都 有 目 
己 的 值 和 类 型 。 和 见 的 整数 、 泽 点 数 类 型 都 文 持 这 几 种 表达 式 。 它 们 
还 可 以 被 重 载 ， 让 目 定义 的 类 型 也 文 持 这 几 种 表达 式 。 运 算 符 重 载 相 
天 的 内 容 会 在 第 26 章 介绍 标准 库 的 时 候 会 详细 说 明 。 


Rnust 的 比较 运算 符 包 括 : 等 于 (==) 、 不 等 于 (! =) 、 小 于 
(<) 、 大 于 (>) 、 小 于 等 于 (<=) 、 大 于 等 于 (>=) 。 上 比较 运算 符 


的 两 边 0 ,并 满足 PartialEq 约 束 。 比较 表达 式 的 类 型 是 
bool。 另 外 ，Rnust 葵 止 连续 比较 ， 示 例如 下 : 


fn f(a: bool, b: bool, c: bool) -> bool { 
;一 一 者 一 一 汪 ( 0 
} 


编译 时 ， 编 译 器 提示 “连续 比较 运算 符 必 须 加 上 括号 


$ rustc --crate-type rlib test.rs 
error: chained comparison operators require parentheses 
--> test.rs:2:7 


| 
2 | 站: 这 全 | 昌 三 三 让 
| 人 人 AAAAAAA 人 


error: aborting due to previous error 


这 也 是 故意 设计 的 ， 避 人 免 不 同 知识 背景 的 用 户 对 这 上 段 代码 有 不 同 
的 理解 。 


Rnust 的 位 运算 符 具 体 见 表 3-1。 
表 31 


运算 符 作用 
按 位 取 反 (注意 不 是 一 人 符号) 


nr 


& 按 位 与 

| 按 位 或 

^ “| 按 位 异 或 
<< 左 移 

> 右 移 


示例 如 下 : 


fn main() { 
Jet num1 : u8 
Jet num2 : u8 


0b_1010_1010 
0b_1111 0000 


println!("{:08b}", !num1); 
println!("{:08b}", numi & num2); 
println!("{:08b}", numi | num2); 
println!("{:08b}", numi ^ num2); 
println!("{:08b}", numi << 4); 
println!("{:08b}", numi >> 4); 


执行 结果 为 : 


$ ./test 
©01010101 
10100000 
11111010 
©01011010 
10100000 
00001010 


Rust 的 逻辑 运算 符 具体 见 表 3-2 。 


取 反 运算 符 既 支持 “逻辑 取 反 ”也 文 持 “ 按 位 取 反 ”*， 它 们 是 同一 个 
运算 符 ， 根 据 类 型 决定 执行 哪个 操作 。 如 采 被 操作 数 是 bool 类 型 ， 那 
0 如 果 被 操作 数 是 其 他 数字 类 型 ， 那 么 就 十 按 位 取 

bool 类 型 既 文 持 “ 逻 辑 与 "*、“ 逻 辑 或 "也 文 持 “ 按 位 与 *、“ 按 位 


° 它们 的 区 别 在 于 ，“ 人 逻辑 与 "、“ 远 辑 或 "具备 “短路 ”功能 。 示 例如 


fn f1() -> bool { 
println!("Call f1"); 
true 


} 


fn f2() -> bool { 
println!("Call f2"); 
false 


} 


fn main() { 
println!("Bit and: {}\n", f2() & f1()); 
println!("Logic and: {}\n", f2() && f1()); 


println!("Bit or: {}\n", f1() | f2()); 
println!("Logic or: {}\n", f1() || f2()); 


执行 结果 为 : 


$ ./test 
call f2 
Call f1 
Bit and: false 


Call f2 
Logic and: false 


Call f1 
Call f2 
Bit or: true 


Call f1 
Logic or: true 


可 以 看 到 ， 所 谓 短路 的 意思 十 : 


.对 于 表达 式 A&&B， 如 果 A 的 值 是 false， 那 么 B 就 不 会 执行 求 值 ， 
直接 返回 false 。 


:对 于 表达 式 Al|IB， 如 果 人 A 的 值 是 true， 那 么 B 就 不 会 执行 求 值 ， 直 


接 返 回 true。 


而 “ 按 位 与 ”\“ 按 位 或 ?在任 何 时 候 都 会 匈 执行 左边 的 表达 式 ， 再 
执行 右边 的 表达 式 ， 不 会 省 略 。 


另外 需要 提示 的 一 点 是 ，Rust 里 面 的 运算 符 优 先 级 与 C 语 言 里 面 的 
运算 符 优 先 级 设置 是 不 一 样 的 ， 有 些 细微 的 差别 。 不 过 这 并 不 是 很 重 


要 。 不 论 在 哪 种 编程 语言 中 ， 我 们 都 建议 ， 如 果 磁 到 复杂 一 点 的 表达 
式 ， 尽 量 用 小 括号 明确 表达 计算 顺序 ， 避 免 依赖 语言 默认 的 运算 符 优 
。 因为 不 同 知识 背景 的 程序 员 对 运算 符 优 先 级 顺序 的 记忆 是 不 同 


3.2.2 ”赋值 表达 式 


一 个 左 值 表达 式 、 赋 值 运 算 符 (=) 和 右 值 表达 式 ， 可 以 构成 一 
个 赋值 表达 式 。 示 例如 下 : 


// 声明 局 部 变量 , 带 mut 修饰 
let mut x : i32 = 1; 


// x 是 mut 绑 定 ,所 以 可 以 为 它 重 新 赋值 
X= 2; 


上 例 中 ，x=2 是 一 个 赋值 表达 式 ， 它 末尾 加 上 分 号 ， 才 能 组 成 一 
个 语句 。 赋 值 表 达 式 具有 “副作用 ”: 当 它 执行 的 时 候 ， 会 把 右边 表达 
式 的 值 “ 复 制 或 者 移动 ” (ee 到 左边 的 表达 式 中 。 关 于 复制 
和 移动 的 语义 区 别 ， 请 参见 第 11 章 的 内 容 。 赋 值 号 左右 两 边 表达 式 的 
类 型 必须 一 致 ， 否 则 是 编译 错误 。 


赋值 表达 式 也 有 对 应 的 类 型 和 值 。 这 里 不 是 说 赋值 表达 式 左 操作 
数 或 石 操作 数 的 类 型 和 值 ， 而 是 说 整个 表达 式 的 类 型 和 值 。Rust 规 
定 ， 赋 值 表达 式 的 类 型 为 unit， 即 空 的 tuple () 。 示 例如 下 : 


fn main() { 
let x = 1; 
let mut y = 2; 
// 注意 这 里 专门 用 括号 括 起 来 】 
let z = (y = x); 
println!("{:?}", Zz); 


编译 ， 执 行 ， 结 果 为 : () 。 


Rust 这 么 设计 是 有 原因 的 ， 比 如 说 可 以 防止 连续 赋值 。 如 果 你 有 
x: i32、y: i32 以 及 z: i32， 那 么 表达 式 z=y=x 会 发 生 编译 错误 。 因 为 


() 对 它 初始 化 了 ， 编 译 器 是 不 允许 通过 


C 语 王爷 证 过 光 卖 赋 值 ， 但 这 个 设计 没有 此 来 任何 性 能 提升， 反而 
在 某 些 场景 下 给 用 户 市 来 了 代码 不 够 清晰 直观 的 麻烦 。 举 个 例子 : 


#include <stdio.h> 


int main() { 
int x = 300; 
char y; 
int Zz; 


z=y= x; 
printf("%d %d %d", x, y, 2z); 


在 这 种 情况 下 ， 如 果 变 量 x、y、z 的 类 型 不 一 样 ， 而 且 在 赋值 的 时 
候 可 能 发 生 截 断 ， 那 么 用 户 很 难 一 眼看 出 最 终 变量 z 的 值 是 与 x 相 同 ， 
还 是 与 y 相 同 。 


这 个 设计 同样 可 以 防止 把 == 写 成 = 的 错误 。 比 如 ，Rust 规 定 ， 在 让 
表达 式 中 ， 它 的 条 件 表达 式 类 型 必须 是 bool 类 型 ， 所 以 if x=y{} 这 样 的 
代码 是 无 论 如 何 都 编译 不 过 的 ， 哪 怕 x 和 y 的 类 型 都 是 bool 也 不 行 。 赋 
值 表达 式 的 类 型 永远 是 () ， 它 无 法 用 于 if 条 件 表达 式 中 。 


Rust 也 文 持 组 合 赋值 表达 式 ，+、 |S 
这 几 个 这 知 符 可 以 和 赋值 运算 符 组 合成 典 值 雪 达 式 ， 示例 如 下 


fn main() { 
let x = 2; 
let mut y = 
y += X/ 


y “= X/ 
println!( "ft {}", x, y); 


LEFT OP=RIGHT 这 种 写法 ， 含 义 等 同 于 LEFT=LEFT OP 
RIGHT 。 所 以 ，y+=x 的 意义 相当 于 y=y+x， 依 此 类 推 。 


Rust 不 文 持 ++、-- 运 算 伯 ， 请 使 用 +=1、-=1 奉 代 。 


323 请 铝 诬 各 过 取 


在 Rust 中 ， 语 句 块 也 可 以 是 表达 式 的 一 部 分 。 语 句 和 表达 式 的 区 
分 方式 是 后 面 带 不 带 分 号 (; ) 。 如 果 带 了 分 号 ， 意 味 着 这 是 一 条 语 
WE 号 ， 写 的 类 型 殉 征 表达 式 的 类 型 。 
示例 如 下 : 


// 语句 块 可 以 是 表达 式 , 注意 后 面 有 分 号 结尾 , x 的 类 型 是 ( ) 
let x : ()={ ran Ln Cuello “站 


// Rust 将 按 顺 序 执行 语句 块 内 的 语句 , 并 将 最 后 一 个 表达 式 类 型 返回 , y 的 类 型 是 i32 
let y : i32 = { println!("Hello."); 5 }; 


同 理 ， 在 画 数 中 ， 我 们 也 可 以 利用 这 样 的 特点 来 写 返回 值 : 


fn my_func() -> i32 { 
// ..， blablabla 各 种 语句 
100 


} 


注 普 ， 最 后 一 条 表达 式 没有 加 分 号 ， 因 此 整个 语句 块 的 类 型 束 变 
成 了 i32， 刚 好 与 玉 数 的 返回 类 型 匹配 。 这 种 写法 与 return 100; 语句 的 
效果 是 一 样 的 ， 相 较 于 retum 语 句 来 说 没有 什么 区 别 ， 但 是 在 更 加 全 谭 。 
特别 是 用 在 后 面 讲 到 的 闭 包 closure 中 ， 这 样 写 就 方便 轻 量 得 多 。 


3.3 if-else 


Rnust 中 if-else 表 达 式 的 作用 是 实现 条 件 分 文 。 计 else 表达 式 的 构成 
方式 为 :以 if 关 键 字 开头 ， 后 面 跟 上 条 件 表 达 式 ， 后 续 是 结果 语句 
块 ， 最 后 是 可 选 的 else 块 。 条 件 表达 式 的 类 型 必须 是 bool 。 


示例 如 下 : 


fn func(i : i32) -> bool { 
if n<0 
print!("{} is negative", n); 
} else if n>0 
print!("{} is positive", n); 


Se lt{ 
print!("{} is zero", n); 


在 让 语句 中 ， 后 续 的 结果 语句 块 要 求 一 定 要 用 大 括号 包 起 来 ， 不 
能 省 略 ， 以 便 明确 指出 该 f 语 句 块 的 作用 范围 。 这 个 规定 是 为 了 避 
免 “ 蔓 空 else” 导 人 致 的 bug。 比 如 下 面 这 上段 C 代 码 : 


if (condition1) 
if (condition2) { 


} 
else { 


} 


请 问 ， 这 个 else 分 支 是 与 第 一 个 过 相 匹配 的 ， 还 是 与 第 二 个 if 相 丐 
配 的 呢 ? 从 可 读 性 上 来 说 ， 答 案 是 不 够 明显 ， 容 易 出 bug。 规 定 if 和 
else 后 面 必须 有 大 括号 ， 可 读 性 会 好 很 多 。 


相反 ， 条 件 表达 式 并 未 强制 要 求 用 小 括号 包 起 来 ; 如 果 加 上 小 括 
号 ， 编 译 和 右 反而 会 认为 这 是 一 个 多 余 的 小 括号 ， 给 出 警告 。 


更 重要 的 是 ，if-else 结 构 还 可 以 当 表 达 式 使 用 ， 比 如 : 


在 这 里 ，if-else 结 构成 了 表达 式 的 一 部 分 。 在 站 和 else 后 面 的 大 括 
号 内 ， 最 后 一 条 表达 式 不 要 加 分 号 ， 这 样 一 来 ， 这 两 个 语句 块 的 类 型 
就 都 是 i32， 与 赋值 运算 符 左 边 的 类 型 刚好 匹配 。 所 以 ， 在 Rust 中 ， 没 
有 必要 专门 设计 像 C/C++ 那 样 的 三 元 运算 符 (? : ) 语法 ， 因 为 通过 
现 有 的 设计 可 以 轻松 实现 同样 的 功能 。 而 且 笔 者 认为 这 样 的 语法 一 致 
性 、 扩 展 性 、 可 读 性 更 好 。 


如 果 使 用 if-else 作 为 表达 式 ， 那 么 一 定 要 注意 ，if 分 支 和 else 分 支 
的 类 型 必须 一 致 ， 否 则 就 不 能 构成 一 个 合法 的 表达 式 ， 会 出 现 编译 错 
误 。 如 果 else 分 支 省 略 掉 了 ， 那 么 编译 器 会 认为 else 分 支 的 类 型 默认 为 
() 。 所 以 ， 下 面 这 种 写法 一 定 会 出 现 编译 错误 : 


fn invalid expr(cond: bool) -> i32 { 
if cond { 
42 
} 


} 


1= note: expected type ‘(). 
found type ‘i32. 


这 看 起 来 像 症 类 型 不 匹配 的 错误 ， 实 际 上 是 漏 写 了 else 分 文 造 成 
的 。 如 果 此 处 编译 右 不 报错 ， 放 任 程序 编译 通过 ， 那 么 在 执行 到 else 
ee 


3.3.1 loop 


在 Rust 中 ， 使 用 loop 表 示 一 个 无 限 死 循环 。 示 例如 下 : 


fn main() 
let mut count = 0uU32 


println!("Let's count until infinity!"); 


// 无 限 循环 
loop { 
count += 工 ; 
if count == 3 
println!("three"); 


// 不 再 继续 执行 后 面 的 代码 , 跳 转 到 1oop 开 头 继续 循环 


continue; 


} 


Rs Count ) ， 
if count == 
oi that's enough"); 


// 跳出 循环 


break 


其 中 ， 我 们 可 以 使 用 continue 和 break 控 制 执行 流程 。continue; 语 
句 表示 本 次 循环 内 ， 后 面 的 语句 不 再 执行 ， 直 接 进 入 下 一 轮 循环 。 
break; 语句 表示 跳出 循环 ， 不 再 继续 。 


另外 ，break 语 句 和 continue 语 句 还 可 以 在 多 重 循环 中 选择 跳出 到 
哪 一 层 的 循环 。 


fn main() { 
// A counter variable 
let mut m = 1; 
let n = 1; 


'a: loop { 
if m < 100 { 
m += 工 ; 
} else { 
'b: loop { 
if m+n>50f 
println!("break"); 
break 'a; 
} else { 
continue 'a; 
} 


} 
} 
} 


我 们 可 以 在 loop while for 循 环 前 面 加 上 “生命 周期 标识 符 ”。 该 标 
识 符 以 单 引 号 开头 ， 在 内 部 的 循环 中 可 以 使 用 break 语 名 选择 跳出 到 哪 


一 层 。 
与 if 结 构 一 样 ，loop 结 构 也 可 以 作为 表达 式 的 一 部 分 。 


fn main() { 
let v = loop { 
break 10; 


}; 
println!("{}", Vv); 


在 loop 内 部 break 的 后 面 可 以 跟 一 个 表达 式 ， 这 个 表达 式 殉 是 最 终 
的 loop 表 达 式 的 值 。 如 果 一 个 loop 永 远 不 返回 ， 那 么 它 的 类 型 就 是 “发 
散 类 型 *。 示例 如下: 


fn main() { 
let v = loop {0}; 
println!("{}", Vv); 


编译 右 可 以 判断 出 v 的 类 型 是 发 散 类 型 ， 而 后 面 的 打印 语句 是 永远 
` 会 执行 的 死 代码 。 


3.3.2 while 


while 语 句 是 市 条 件 判断 的 循环 语句 。 其 语法 是 while 关 键 子 后 跟 条 
件 判断 语句 ， 最 后 是 结果 语句 块 。 如 果 条 件 满足 ， 则 持续 循环 执行 结 
果 语 句 块 。 示 例如 下 : 


fn main() { 
// A counter variable 
Jet mut n = 1; 
// Loop while ‘n. is less than 101 
while n < 101 { 
if n % 15 == 0 { 
println! ("fizzbuzz"); 
} else if n%3 ==0f{ 
println! ("fizz"); 
} else if n%5 ==0f{ 
println! ("buzz"); 
} else { 
println!("{}", n); 


// Increment counter 
n += 1; 
} 
} 


同 理 ，while 语 句 中 也 可 以 使 用 continue 和 break 来 控制 循环 流程 。 


看 到 这 里 ， 读 者 可 能 会 产生 疑惑 : loop{} 和 while true{} 循 环 有 什 
么 区 别 ， 为 什么 Rust 专 门 设计 了 一 个 死 循环 ，loop 语 句 难 道 不 是 完全 
多 余 的 吗 ? 


实际 上 不 是 。 主 要 原因 在 于 ， 相 比 于 其 他 的 许多 语言 ，Rust 语 言 
要 做 更 多 的 静态 分 析 。loop 和 while true 语 句 在 运行 时 没有 什么 区 别 ， 
它们 主要 是 会 影响 编译 需 内 部 的 静态 分 析 结 采 。 比 如 : 


let x; 
loop { x = 1; break; } 
println!("{}", x) 


以 上 语句 在 Rust 中 完全 合理 。 因 为 编译 右 可 以 通过 流程 分 析 推 理 
出 x=1; 必然 在 println! 之 前 执行 过 ， 因 此 打印 变量 x 的 值 是 完全 合理 
的 。 而 下 面 的 代码 是 编译 不 过 的 : 


let x; 
while true { x = 1; break; } 
println!("{}", x); 


_ 因 为 编译 器 会 觉得 while 语 句 的 执行 跟 条 件 表达 式 在 运行 阶段 的 值 
有 天 ， 因此 它 不 确定 x 是 否 一 定 会 初始 化 ， 于 是 它 决 定 给 出 一 个 错误 : 
use of possibly uninitialized variable， 也 就 是 说 变量 x 可 能 没有 初始 化 。 


3.3.3 for 循环 


Rnust 中 的 for 循 环 实际 上 是 许多 其 他 语言 中 的 foreach 循 环 。Rust 中 
没有 类 似 C/C++ 的 三 段 式 for 循 环 语句 。 举 例如 下 : 


fn main() { 
let array = &[1,2,3,4,5]; 


for i in arra 
println!("The number is {}", i); 


for 循 环 的 主要 用 处 是 利用 送 代 絮 对 包含 同样 类 型 的 多 个 元 素 的 容 
铝 执 行 仙 历 ， 如 数组 、 链 表 、HashMap、HashSet 等 。 在 Rust 中 ， 我 们 
0 自己 的 容器 适 代 器 ， 因 此 也 很 容易 使 for 循 环 也 支持 

定义 类 型 。 


for 循 环 内 部 也 可 以 使 用 continue 和 break 控 制 执行 流程 。 
有 关 for 御 环 的 原理 以 及 迭代 右 相 关内 容 ， 参 见 第 24 章 。 


4.1 简介 


Rnust 的 函数 使 用 关键 字 甸 开头 。 男 数 可 以 有 一 系列 的 输入 参数 ， 
还 有 一 个 返回 类 型 。 函 数 体 包含 一 系列 的 语句 (或 者 表达 式 ) 。 画 数 
返回 可 以 使 用 return 语 句 ， 也 可 以 使 用 表达 式 。Rust 编 写 的 可 执行 程序 
的 入 口 就 是 mp main () 函数 。 以 下 是 一 个 函数 的 示例 : 


fn addi(t : (i32,i32)) -> i32 { 
t.0 + t.1 
} 


这 个 函数 有 一 个 输入 参数 ， 其 类 型 是 tuple (i32，i32) 。 它 有 一 
个 返回 值 ， 返 回 类 型 是 i32。 团 数 的 参数 列表 与 let 语 名 一样， 也 是 一 
个 “模式 解构 ”。 模式 结构 的 详细 解释 请 参考 第 7 章 。 上 述 函 数 也 可 以 写 
成 下 面 这 样 : 


fn add2((x,y) : (i32,i32)) -> i32 { 
x+y 


} 


函数 体内 部 是 一 个 表达 式 ， 这 个 表达 式 的 值 殉 是 男 数 的 返回 值 。 
也 可 以 写 retum x+y; 这 样 的 语句 作为 返回 值 ， 效 果 十 一 样 的 。 

国 数 也 可 以 不 写 返回 类 型 ， 在 这 种 情况 下 ， 编 译 亏 会 认为 返回 类 
型 是 unit () 。 此 处 和 表达 式 的 规定 是 一 致 的 。 


函数 可 以 当成 头等 公民 (first class value) 被 复制 到 一 个 值 中 ， 这 
个 值 可 以 像 函数 一 样 被 调用 。 示 例如 下 : 


fn main() { 
let p = (1, 3); 


// func 是 一 个 局 部 变量 
let func = add2; 
// func 可 以 被 当成 普通 函数 一 样 被 调用 


println!("evaluation output {}", func(p)); 


在 Rust 中 ， 每 一 个 函数 部 具有 目 己 单独 的 类 型 ,但 
以 目 动 转换 到 和 类 型 。 示 例如 下 : 


fn main() { 
// 先 让 func 指向 add1 
let mut func = addi; 
// 再 重新 赋值 ,让 func 指向 add2 
func = add2,; 


编译 ， 会 出 现 编译 错误 ， 如 下 : 


error[E0308]: mismatched types 
--> test.rs:11:12 


11 func = add2， 


| 
| 
| AAAA expected fn item, found a different fn item 
| 


note: expected type ‘fn((i32, i32)) -> i32 {add1} 
found type ‘fn((i32, i32)) -> i32 {add2}. 


虽然 add1 和 add2 有 同样 的 参数 类 型 和 同样 的 返回 值 类 型 
0 ° 修复 方案 是 让 func 的 类 型 为 通 
型 口 ] : 


// 写法 一 ,用 as 类 型 转换 
let mut func = add1 as fn((i32,i32))->i32; 
// 写法 二 , 用 显 式 类 型 标记 


let mut func : fn((i32,1i32))->i32 = add1， 


以 上 两 种 写法 都 能 修复 上 面 的 编译 错误 。 但 是 ， 我 们 不 能 


数 、 返 回 值 类 型 不 同 的 情况 下 作 类 型 转换 ， 比 如 : 


fn add3(x: i32, y: i32) -> i32 { 
X + y 
} 


fn main() { 
let mut func : fn((i32,1i32))->i32 = add1， 
func = add2,; 


征 这 个 类 型 可 


， 但 它们 
前 用 的 fn 


在 参 


func = add3; 


这 里 再 加 了 一 个 add3 函 数 ， 它 接受 两 个 i32 参 数 ， 
add2 有 了 本 质 区 别 。add1 和 add2 是 一 个 参数 ， 类 型 是 


这 就 跟 add1 和 
是 tuple 包 含 I 


成 员 ， 而 add3 古 两 个 i132 参数 。 三 者 完全 不 一 样 ， 它 们 之 间 是 无 法 进 


类 型 转换 的 。 


及 外 党 要 提示 的 束 是 ，Rust 的 座 数 体内 也 允许 害 义 其 他 item， 包 
括 静 态 变 量 、 常 量 、 辑 数 、trait、 类 型 、 模 块 等 。 比 如 : 


fn test_inner() { 
static INNER_STATIC: i64 = 42; 


// 画 数 内 部 定义 的 本 数 

fn internal incr(x: i64) -> i64 { 
所 六 

} 


struct InnerTemp(i64); 


impl] InnerTemp { 
fn incr(&mut self) 区 
self.0 = internal_ incr(self.0); 
} 


} 


// 画 数 体 ,执行 语句 

let mut t = InnerTemp(INNER_STATIC); 
t.incr(); 

println!("{}", t.0); 


当 你 需要 一 些 item 仅 在 此 函数 内 有 用 的 时 候 ， 可 以 把 它们 直接 定 


义 到 函数 体内 ， 以 避免 污染 外 部 的 命名 至 


间 。 


4.2 ”发 艇 团 数 


Rust 支 持 一 种 特殊 的 发 散 函 数 (Diverging functions) ， 它 的 返回 
Sa 
¥ 


fn diverges() -> ! 
panic!("This function never returns!"); 


因为 panic! 会 直接 导致 栈 展 开 ， 所 以 这 个 函数 调用 后 面 的 代码 都 
不 会 继续 执行 ， 它 的 返回 类 型 就 是 一 个 特殊 的 ! 符号 ， 这 种 函数 也 叫 
ee 
型 。 0: 


let x : i32 = diverges(); 
let y : String = diverges(); 


我 们 为 什么 需要 这 样 的 一 种 返回 类 型 呢 ? 先 看 下 面 的 例子 : 


let p= if x{ 
panic!("error"); 
} else { 
100 
}; 
上 面 这 条 语句 中 包含 一 个 if-else 分 文 结构 的 表达 式 。 我 们 知道 ， 对 
于 分 文 结构 的 表达 式 ， 它 的 每 条 分 文 的 夫 型 必须 一 致 。 那 么 这 条 
panic! 宏 应 该 生成 一 个 什么 类 型 呢 ? 这 就 是 ! 类 型 的 作用 了 。 因 为 它 
可 以 与 任意 类 型 相 容 ， 所 以 编译 器 的 类 型 检查 才能 通过 。 
在 Rust 中 ， 有 以 下 这 些 情况 永远 不 会 返回 ， 它 们 的 类 型 就 是 ! 。 


-panic! 以 及 基于 它 实 现 的 各 种 函数 / 宏 ， 比 如 unimplemented! 、 
unreachable! ; 


: 死 循环 loop{}; 


.进程 退出 函数 std: : process: : exit 以 及 类 似 的 libc 中 的 exec 一 类 
函数 。 


| 关于 这 个 类 型 ， 第 8 章 在 对 类 型 系统 做 更 深入 分 析 的 时 候 还 会 再 
是 到 。 


4.3 main 范 数 


在 大 部 分 主流 操作 系统 上 ， 一 个 进程 开始 执行 的 时 候 可 以 接受 一 
系列 的 参数 ， 退 出 的 时 候 也 可 以 返回 一 个 错误 码 。 许 多 编程 语言 也 因 
此 为 main 函 数 设计 了 人 参数 和 返回 值 类 型 。 以 C 语 言 为 例 ， 主 函数 的 原 
型 一 般 允 许 定 义 成 以 下 几 种 形式 : 


int main(void),; 
int main(); 


int main(int argc, char **argv); 
int main(int argc, char *argv[]); 
int main(int argc, char **argv, char **env); 


Rust 的 设计 稍微 有 点 不 一 样 ， 传 递 参数 和 返回 状态 码 都 由 单独 的 
API 来 完成 ， 示 例如 下 : 


fn main() { 
for arg in std::env::args() { 
println!("Arg: {}", arg); 
} 


std: :process: :exit(0); 


编译 ， 执 行 并 携带 儿 个 参数 ， 可 以 看 到 : 


$ test -opt1 opt2 -- opt3 
Arg: test 

Arg: -opt1 

Arg: opt2 

Arg: -- 

Arg: opt3 


每 个 被 空格 分 开 的 字符 串 都 是 一 个 参数 。 进 程 可 以 在 任何 时 候 调 
用 exit () 直接 退出 ， 退 出 时 候 的 错误 码 由 exit () 函数 的 参数 指定 。 


如 果 要 读 取 环境 变量 ， 可 以 用 std: : Env: : Var () 以 及 std: : 
env: : Vars () 函数 获得 。 示 例如 下 : 


fn main() { 
for arg in std::env::args() { 
match std::env::var(&arg) { 
Ok(val) => printin!("{}: {:?}", &arg, val), 
Err(e) => println!("couldn't find environment {}, {}", &arg, e), 
} 
} 


println!("All environment varible count {}", std::env::vars().count()); 


var () 画 数 可 以 接受 一 个 字符 串 类 型 参数 ， 用 于 查找 当前 环境 变 
量 中 是 否 存在 这 个 名 字 的 环境 变量 ，vars () 而 数 不 携 带 参 数 ， 可 以 
返回 所 有 的 环境 变量 。 


此 前 ，Rust 的 main 范 数 只 支持 无 参数 、 无 返回 值 类 型 的 声明 方 
式 ， 即 main 函 数 的 签名 固定 为 : fn main () -> () 。 但 是 ， 在 引入 
了 2? 符号 作为 错误 处 理 语法 糖 之 后 ， 就 变 得 不 那么 优雅 了 ， 因 为 ? 符 
号 要 求 当 前 所 在 的 函数 返回 的 是 Result 类 型 ， 这 样 一 来 ， 问 号 就 无 法 
直接 在 main 函 数 中 使 用 了 。 为 了 解决 这 个 问题 ，Rust 设 计 组 扩展 了 
main 芳 数 的 人 签名， 使 它 变 成 了 一 个 沁 型 函数 ， 这 个 函数 的 返回 类 型 可 
以 是 任何 一 个 满足 Terminationtrait 约 束 的 类 型 ， 其 中 () 、bool、 
Result 都 是 满足 这 个 约束 的 ， 它 们 都 可 以 作为 main 范 数 的 返回 类 型 。 
关于 这 个 问题 ， 可 以 参见 第 33 章 。 


4.4 constfn 


函数 可 以 用 const 关 键 字 修 贤 ， 这 样 的 画 数 可 以 在 编译 阶段 家 编译 
絮 执 行 ， 返 回 值 也 被 视 为 编译 期 肖 量 。 示 例如 下 : 


#![feature(const_fn)] 


const fn cube(num: usize) -> usize { 
num * num * num 


} 
fn main() { 
const DIM : usize = cube(2); 
const ARR : [i32; DIM] = [0; DIM]; 


println!("{:?}", ARR); 


cube 函 数 接受 数 子 参 数 ， 它 会 返回 一 个 数字 ， 而 且 这 个 返回 值 本 
喘 可 以 用 于 给 一 个 const 钊 量 做 初始 化 ，const 第 量 又 可 以 当成 一 个 常量 
数组 的 长 度 使 用 。 


const 芳 数 古 在 编译 阶段 执行 的 ， 因 此 相 比 普通 钞 数 有 许多 限制 ， 
并 非 所 有 的 表达 式 和 语句 部 可 以 在 其 中 使 用 。 鉴 于 目前 这 个 功能 还 没 
有 完全 稳定 ，const 函 数 具体 有 哪些 限制 规则 ， 本 书 就 不 在 此 问题 上 详 
细 展 开 了 ， 后 面 也 许 还 会 有 调整 。 


4.5” 芳 数 圳 归 调 用 


Rnust 允 许 函 数 递归 调用 。 所 谓 递 归 调 用 ， 指 的 是 函数 直接 或 者 间 
接 调 用 目 己 。 下 面 用 经 典 的 Fibonacci 数 列 来 举例 : 


fn fib(index: U32) -> u64 { 


if index == 1 || index == 2 { 
} { 
fib(index - 1) + fib(index - 2) 
} 
fn main() { 


let f8 = fib(8); 
println!("{}", f8); 


0 因为 在 它 的 函数 体内 又 调 
用 了 它 目 己 。 


谈 到 递归 调用 ， 许 多 读者 都 会 目 然 联 想到 " 尾 递归 优化 "这 个 概 
念 。 可 惜 的 是 ， 当 前 版 本 的 Rust 和 暂时 还 不 支持 尾 递归 优化 ， 因 此 如 果 
递归 调用 层次 太 多 的 话 ， 是 有 可 能 返 爆 栈 空 间 的 。 不 过 这 个 问题 已 经 
在 设计 讨论 之 中 ， 各 位 读者 可 以 从 最 新 的 RFC 项 目 中 了 解 进度 。 


第 5 章 trait 


Rust 语 言 中 的 trait 十 非 宙 重要 的 概念 。 在 Rust 中 ，trait 这 一 个 概念 
承担 了 多 种 职责 。 在 中 文 里 ，trait 可 以 翻译 为 “特征 ”特点 ”特性 ?等 。 
区 分 度 并 不 明显 ， 在 本 书 中 一 律 不 翻译 trait 文 个 词 ， 以 避 

义 。 


ait 中 可 以 包含 ， 丽 数 、 常 量 、 类 型 等 。 


5.1 成 员 方 法 
trait 中 可 以 定义 画 数 。 用 例子 来 说 明 ， 我 们 定义 如 下 的 trait: 


trait Shape { 
fn area(&self) -> f64; 


上 面 这 个 trait 包 含 了 一 个 方法 ， 这 个 方法 具有 一 个 参数 这 个 
&self 参 数 是 什么 意思 呢 ? 


所 有 的 trait 中 都 有 一 个 隐藏 的 类 型 Self (大 写 S) ， 代 表 当 前 这 个 
实现 了 此 trait 的 具体 类 型 。trait 中 定义 的 函数 ， 也 可 以 称 作 关 联 函 数 
(associated function) 。 画 数 的 第 一 个 参数 如 果 是 Self 相 关 的 类 型 ， 且 
命名 为 self (小 写 s) ， 这 个 参数 可 以 被 称 为 "receiver” (接收 者 ) 。 具 
有 receiver 参 数 的 函数 ， 我 们 称 为 “方法 ”(method) ， 可 以 通过 变量 实 
例 使 用 小 数 点 来 调用 。 没 有 receiver 参 数 的 函数 ， 我 们 称 为 “静态 画 
数 ” (static function) ， 可 以 通过 类 型 加 双 冒 号 : : 的 方式 来 调用 。 在 
Rust 中 ， 画 数 和 方法 没有 本 质 区 别 。 


Rust 中 Self (大 写 S) 和 self (小 写 s) 都 是 关键 字 ， 大 写 S 的 是 类 型 
和 名， 小 写 s 的 是 变量 名 。 请 大 家 一 定 注 意 区 分 。self 参 数 同样 也 可 以 指 
定 类 型 ， 当 然 这 个 类 型 是 有 限制 的 ， 必 须 是 包装 在 Self 类 型 之 上 的 类 
型 。 对 于 第 一 个 self 参 数 ， 常 见 的 类 型 有 self: Self 、self: &Self、 
self: &mut Self 等 类 型 。 对 于 以 上 这 些 类 型 ，Rust 提 供 了 一 种 简化 的 写 
法 ， 我 们 可 以 将 参数 简写 为 self、&self、&mut self。self 参 数 只 能 用 在 
J ° 请 注意 “变量 self* 和 “类 型 Self” 的 大 小 写 不 同 。 示 
列 如 下 : 


trait T { 
fn methodi(self: Self); 
fn method2(self: &Self); 
fn method3(self: &mut Self); 


} 
// 上 下 两 种 写法 是 完全 一 样 的 
trait T { 
fn method1i(self); 
fn method2(&self); 


fn method3(&mut self); 
} 


所 以 ， 加 到 开始 定义 的 那个 Shape trait， 上 面 定义 的 这 个 area 方 法 
的 参数 的 名 字 为 self， 它 的 类 型 是 &Self 类 型 。 我 们 可 以 把 上 面 这 个 方 
法 的 声明 看 成 : 


trait Shape { 
fn area(self: &Self) -> f64; 


我 们 可 以 为 某 些 具体 类 型 实现 (impl) 这 个 trait。 
二 假如 我 们 有 一 个 结构 体 类 型 Circle， 它 实现 了 这 个 trait， 人 代码 如 


Struct Circle { 
radius: f64, 
} 


impl Shape for Circle { 
// Self 类 型 就 是 Circle 
// self 的 类 型 是 &Self, 即 &Circle 
fn area(aselt). -> f64 { 
// 访问 成 员 变 量 , 需 self.radius 
std::f64::consts::PI * self.radius * Self.radius 


} 
} 


fn main() { 
let c = Circle { radius : 2f64}; 
// 第 一 个 参数 名 字 是 selLf, 可 以 使 用 小 数 点 语法 调 
println!("The area is {}", c.area()); 


} 


在 上 面 的 例子 中 可 以 看 到 ， 如 果 有 一 个 Circle 类 型 的 实例 c， 我 们 
就 可 以 用 小 数 点 调用 函数 ，c.area () 。 在 方法 内 部 ， 我 们 可 以 通过 
self.radius 的 方式 访问 类 型 的 内 部 成 员 。 


男 外 ， 针 对 一 个 类 型 ， 我 们 可 以 直接 对 它 impl 来 增加 成 员 方 法 ， 
无 须 trait 名 子 。 比 如 : 


impl Circle { 
fn get_radius(&self) -> f64 { self.radius } 


我 们 可 以 把 这 段 代码 看 作 是 为 Circle 类 型 imp1 了 一 个 匿名 的 trait 。 
用 这 种 方式 定义 的 方法 叫 作 这 个 类 型 的 “内 在 方法 ” i 


methods) 。 


trait 中 可 以 包含 方法 的 默认 实现 。 如 果 这 个 方法 在 trait 中 已 经 有 了 
那么 在 针对 具体 类 型 实现 的 时 候 ， 束 可 以 选择 不 用 重 写 。 当 
A ， 如 果 需 要 针对 特殊 类 型 作 特 殊 处 理 ， 也 可 以 选择 重新 实现 
ee 比如 ， 在 标准 库 中 ， 友 代 器 Iterator 这 个 
trait 中 就 包含 了 十 多 个 方法 ， 但 是 ， 其 中 只 有 fn next (&mut self) - 
>Option<Self: : Item> 是 没有 默认 实现 的 。 其 他 的 方法 均 有 其 默认 实 
现 ， 在 实现 迭代 虽 的 时 候 只 需 挑 选 需 要 重 写 的 方法 来 实现 即 可 。 


self 参 数 甚 至 可 以 是 Box 指 针 类 型 self: Box<Self>。 另 外 ， 目 前 
Rust 设 计 组 也 在 考虑 让 self 变 量 的 类 型 放 得 更 宽 ， 允 许 更 多 的 目 定义 类 
型 作为 receiver， 比 如 MyType<Self>。 示 例如 下 : 


trait Shape { 
fn area(self: Box<Self>) -> f64; 


struct Circle { 
radius: f64, 
} 


impl Shape for Circle { 
// Self 类 型 就 是 Circle 
// self 的 类 型 是 Box<Self>, 即 Box<Circle> 
fn area(self : Xe te) -> f64 { 
// 访问 成 员 变量 ， self.radius 
std::f64: SEE :PI * Self.radius * self.radius 


} 


} 


fn main() { 
let c = Circle { radius : 2f64}; 
// 编译 错误 
// c.areal); 


let b = Box::new(Circle {radius : 4f64}); 
// 编 译 正 确 日 
b ,areal( ); 


impl 的 对 象 甚至 可 以 是 trait。 示例 如下: 


trait Shape { 
fn area(&self) -> f64; 


trait Round { 


fn get_radius(&self) -> f64; 
} 


struct Circle { 
radius: f64, 
} 


impl] Round for Circle 
fn get_radius(&self) -> f64 { self.radius } 


// 注意 这 里 是 ijmpl Trait for Trait 
impl Shape for Round { 
fn area(&self) -> f64 { 
std::f64::consts::PI * self.get_ radius() * self.get_radius() 
} 


} 


fn main() { 
let c = Circle { radius : 2f64},; 
// 编译 错误 
// c.areal); 


let b = Box::new(Circle {radius : 4f64}) as Box<Round>; 
// 编译 正太 
b .areal( ); 


注意 这 里 的 写法 ，impl Shape for Round 和 impl<T: Round>Shape 
for T 是 不 一 样 的 。 在 前 一 种 写法 中 ，self 是 &Round 类 型 ， 它 是 一 个 trait 
object， 是 胖 指 针 。 而 在 后 一 种 写法 中 ，self 是 &T 类 型 ， 是 具体 类 型 。 
前 一 种 写法 是 为 trait object 增 加 一 个 成 员 方 法 ， 而 后 一 种 写法 是 为 所 有 
的 满足 T: Round 的 具体 类 型 增加 一 个 成 员 方 法 。 所 以 上 面 的 示例 中 ， 
我 们 只 能 构造 一 个 trait object 之 后 才能 调用 area () 成 员 方 法 。trait 
object 和 和“ 沁 型 * 之 则 的 区 别 请 参考 本 书 第 三 部 分 。 


题 外 话 ，impl Shape for Round 这 种 写法 确实 是 很 让 初学 者 纠结 
的 ，Round 既 是 trait 又 是 type。 在 将 来 ，trait object 的 语法 会 被 要 求 加 上 
dyn 关 键 字 ， 所 以 在 Rust 2018 edition 以 后 应 该 写成 impl Shape for dyn 
Round 才 人 合理。 关于 trait object 的 内 容 ， 请 参考 本 书 第 三 部 分 第 23 章 。 


5.2 ”静态 方法 


没有 receiver 人 参数 的 方法 〈 第 一 个 参数 不 是 self 参 数 的 方法 ) 称 
作 “ 静 态 方法 ”。 静 态 方法 可 以 通过 Type: : FunctionName () 的 方式 
调用 。 需 要 注意 的 是 ， 即 便 我 们 的 第 一 个 参数 是 Self 相 关 类 型 ， 只 
变量 名 字 不 是 self， 就 不 能 使 用 小 数 点 的 语法 调用 画 数 。 


struct T(i32); 


impl] T { 
// 这 是 一 个 静态 方法 

fn func(this: &Self) 
println!i{"value {}", this.0O}; 


} 


fn main() { 
let x = T(42); 
// XxX.func(); 小 数 点 方式 调用 是 不 合法 的 
T::func(&x); 

} 


在 标准 库 中 就 有 一 些 这 样 的 例子 。Box 的 一 系列 方法 Box: : 

into raw (b: Self) Box: : leak (b: Self) ， 以 及 Rc 的 一 系列 方法 

Re: : try unwrap (this: Self) Rc: : downgrade (this: &Self) ， 都 
是 这 种 情况 。 它 们 的 receiver 不 是 self 关 键 字 ， 这 样 设计 的 目的 是 强制 
用 户 用 Rec: : downgrade (&obj) 的 形式 调用 ， 而 禁止 obj.downgrade 
WU 形式 的 调用 。 这 样 源码 表达 出 来 的 意思 更 清晰 ， 不 会 因为 Rc<T> 
里 面 的 成 员 方 法 和 T 里 面 的 成 员 方 法 重 名 而 造成 误解 问题 (这 又 涉及 
Deref trait 的 内 容 ， 读 者 可 以 把 第 16 章 读 完 再 回 看 这 一 段 ) 。 


trait 中 也 可 以 定义 静态 函数 。 下 面 以 标准 库 中 的 std: : 
default: : Default trait 为 例 ， 介 绍 静 态 函 数 的 相关 用 法 : 


pub trait Default { 
fn default() -> Self; 
} 


上 上面 这 个 trait 中 包含 了 一 个 default () 国 数 ， 它 是 一 个 无 参数 的 函 
数 ， 返 回 的 类 型 是 实现 该 trait 的 具体 类 型 。Rust 中 没有 “构造 钞 数 ”的 概 


念 。Default trait 实 际 上 可 以 看 作 一 个 针对 无 参数 构造 久 数 的 统一 抽 
象 O 


型 


比如 在 标准 库 中 ，Vec: : default () 避 是 一 个 普通 的 静态 函数 。 


// 这 里 用 到 了 ”* 泛 型 ”， 请 参阅 第 21 刀 

impl<T> Default for Vec<T> { 

fn default() -> Vec<T> { 
Vec: :new() 


跟 C++ 相 比 ， 在 Rust 中 ， 定 义 静 态 函 数 没 必要 使 用 static 天 键 子 ， 
因为 它 把 self 参 数 显 式 在 参数 列表 中 列 出 来 了 。 作 为 对 比 ，C++ 里 面 成 
员 方法 默认 可 以 访问 this 指 针 ， 因 此 它 需 要 用 static 关 键 字 来 标记 静态 
方法 。Rust 不 采取 这 个 设计 ， 主 要 原因 是 self 参 数 的 类 型 变化 太 多 ， 不 
同 写法 语义 差别 很 大 ， 选 择 显 式 声 明 self 参 数 更 方便 指定 它 的 类 型 。 


5.3 扩展 方法 


我 们 还 可 以 利用 trait 给 其 他 的 类 型 添加 成 员 方 法 ， 哪 怕 这 个 类 型 
不 是 我 们 目 己 写 的 。 比 如 ， 我 们 可 以 为 内 置 类 型 32 添加 一 个 方法 : 


trait Double 
fn double(&self) -> Self; 


impl Double for i32 { 
fn double(&self) -> i32 { *self * 2 } 


fn main() { 
// 可 以 像 成 员 方 法 一 样 调 
let x : i32 = 10.double(); 
println!("{}", x); 

} 


这 个 功能 束 像 c# 里 面 的 小 展 方法 ”一样 。 哪 旧 这 个 类 型 不 是 在 当 
前 的 项 目 中 声明 的 ， 我 们 依然 可 以 为 它 增 加 一 些 成 员 方 法 。 但 我 们 也 
不 征 随 随便 便 束 可 以 这 么 做 的 ，Rust 对 此 有 一 个 规定 。 


在 声明 trait 和 impl trait 的 时 候 ，Rnust 规 定 了 一 个 Coherence Rule 
《一致 性 规则 ) 或 称 为 Orphan Rule (孤儿 规则 ) : impl 块 要 么 与 trait 
的 声明 在 同一 个 的 crate 中 ， 要 么 与 类 型 的 声明 在 同一 个 crate 中 。 


也 歌 是 说 ， 如 果 trait 来 自 于 外 部 crate， 而 且 类 型 也 来 目 于 外 部 
crate， 编 译 器 不 允许 你 为 这 个 类 型 impl 这 个 trait。 它 们 之 中 必须 至 少 有 
一 个 是 在 当前 crate 中 定义 的 。 因 为 在 其 他 的 crate 中 ， 一 个 类 型 没有 实 
现 一 个 trait， 很 可 能 是 有 意 的 设计 。 如 采 我 们 在 使 用 其 他 的 crate 的 时 
候 ， 强 行 把 它们 *“ 拉 即 配 ?”， 是 会 制造 出 bug 的 。 比 如 说 ， 我 们 写 了 一 个 
程序 ， 引 用 了 外 部 库 lib1 和 lib2，lib1 中 声明 了 一 个 traitT，lib2 中 声明 
了 一 个 struct S$， 我 们 不 能 在 自己 的 程序 中 针对 S 实 现 T。 这 也 意味 着 ， 
上 游 开 发 者 在 给 别人 写 库 的 时 候 ， 尤 其 要 注意 ， 一 些 比较 常见 的 标准 
库 中 的 trait， 如 Display Debug ToString Default 等 ， 应 该 尽 可 能 地 提供 
。 否则， 使 用 这 个 库 的 下 游 开发 者 是 没 办 法 帮 我 们 把 这 些 trait 实 现 


同 理 ， 如 果 是 匿名 imnp1， 那 么 这 个 impl 块 必须 与 类 型 本 身 存 在 于 
同一 个 crate 中 。 


更 多 关于 "一致 性 规则 ”的 解释 ， 可 以 参见 编译 右 的 详细 错误 说 


rustc --explain E0117 
rustc --explain E0210 


当 类 型 和 trait 涉 及 泛 型 参数 的 时 候 ， 一 致 性 规则 实际 上 古 很 复杂 
的 ， 用 户 如 采 需 要 了 解 所 有 的 细节 ， 还 需要 参考 对 应 的 RFC 文 档 。 


许多 初学 者 会 用 目 沉 GC 的 语言 中 的 “Interface”、 抽 和 象 基 类 来 理解 
trait 这 个 概念 ， 但 是 实际 上 它们 有 很 大 的 不 同 。 


Rnust 是 一 种 用 户 可 以 对 内 存 有 精确 控制 能 力 的 强 类 型 语言 。 我 们 
可 以 目 由 指定 一 个 变量 是 在 栈 里 面 ， 还 是 在 堆 里 面 ， 变 量 和 指针 也 是 
不 同 的 类 型 。 类 型 是 有 大 小 (Size) 的 。 有 些 类 型 的 大 小 是 在 编译 阶 
段 可 以 确定 的 ， 有 些 类 型 的 大 小 十 编译 阶段 无 法 确定 的 。 目 前 版 本 的 
Rust 规 定 ， 在 函数 参数 传递 、 返 回 值 传递 等 地 方 ， 都 要 求 这 个 类 型 在 
编译 阶段 有 确定 的 大 小 。 否 则 ， 编 译 右 束 不 知道 该 如 何 生 成 代码 了 。 


而 trait 本 吴 既 不 是 具体 类 型 ， 也 不 是 指针 类 型 ， 它 只 是 定义 了 针 
对 类 型 的 、 抽 象 的 “约束 ”。 不 同 的 类 型 可 以 实现 同一 个 trait， 满 足 同一 
个 trait 的 类 型 可 能 具有 不 同 的 大 小 。 因 此 ，trait 在 编译 阶段 没有 固定 大 
小 ， 目 前 我 们 不 能 直接 使 用 trait 作 为 实例 变量 、 参 数 、 返 回 值 。 


有 一 些 初 学 者 特别 喜欢 写 这 样 的 代码 : 


let x: Shape = Circle::;new(); // Shape 不 能 做 局 部 变量 的 类 型 
fn use_shape(arg : Shape) {} // Shape 不 能 直接 做 参数 的 类 型 
fn ret_shape() -> Shape {} // Shape 不 能 直接 做 返回 值 的 类 型 


Es 


这 样 的 写法 是 错误 的 。 请 一 定 要 记 住 ，trait 的 大 小 在 编译 阶段 是 
不 固定 的 。 那 怎样 写 才 是 对 的 呢 ? 后 面 我 们 讲 到 泛 型 的 时 候 再 说 。 


5.4 完整 范 数 调用 语法 


Fully Qualified Syntax 提 供 一 种 无 蚊 义 的 函数 调用 语法 ， 人 允许 程序 
员 精 确 地 指定 想 调 用 的 是 那个 函数 。 以 前 也 叫 UFCS_ (universal 
function call syntax) ， 也 就 是 所 谓 的 “通用 函数 调用 语法 ”。 这 个 语法 
可 以 允许 使 用 类 似 的 写法 精确 调用 任何 方法 ， 包 括 成 员 方法 和 静态 方 
法 。 其 他 一 切 函 数 调用 语法 都 是 它 的 某 种 简略 形式 。 它 的 具体 写法 为 
<T as TraitName>: : item。 示 例如 下 : 


trait Cook 
fn start(&self); 


trait Wash 
fn start(&self); 


Struct Chef ， 


Impl1 Cook for Chef { 
fn start(&self) { println!("Cook::start");} 


impl Wash for Chef 
fn start(&self) { println!("wash::start");} 


fn main() { 
let me = Chef; 
me.start(); 


} 


我 们 定义 了 两 个 trait， 它 们 的 start () 画 数 有 同样 方法 签名 。 


如 果 一 个 类 型 同时 实现 了 这 两 个 trait， 那 么 如 果 我 们 使 用 
variable.start () 这 样 的 语法 执行 方法 调用 的 话 ， 就 会 出 现 层 义 ， 编 译 
如 不 知道 你 具体 想 调 用 哪个 方法 ， 编 译 错误 信息 为 “multiple applicable 
items in scope” ° 


这 时 候 ， 我 们 残 有 必要 使 用 完整 的 函数 调用 语法 来 进行 方法 调 
才能 清晰 明白 且 无 歧义 地 表达 清楚 期 望 调用 的 是 哪 
广 欧 弘 X: 


fn main() { 
let me = Chef; 

// 函数 名 字 使 用 更 完整 的 path 来 指定 , 同时 , self 参 数 需要 显 式 传递 
<Cook>: :start(&me); 
<Chef as Wash>::start(&me); 


} 


由 此 我 们 也 可 以 看 到 ， 所 请 的 “成 员 方 法 ”也 没什么 特殊 之 处 ， 它 
跟 普 通 的 静态 方法 的 唯一 区 别 是 ， 第 一 个 参数 是 self， 而 这 个 self 只 是 
一 个 靖 通 的 轴 数 参数 而 已 。 只 不 过 这 种 成 员 方 法 也 可 以 通过 变量 加 小 
数 点 的 方式 调用 。 变 量 加 小 数 点 的 调用 方式 在 大 部 分 情况 下 看 起 来 更 
简单 更 美观 ， 完 全 可 以 视 为 一 种 语法 糖 。 


需要 注意 的 是 ， 通 过 小 数 点 语法 调用 方法 调用 ， 有 一 个 “ 隐 泸 
着 ”的 “ 取 引 用 ”步骤 。 虽 然 我 们 看 起 来 源 代 码 长 的 是 这 个 样子 me.start 
() ， 但 是 大 家 心里 要 清楚 ， 真 正 传递 给 start () 方法 的 参数 是 &me 
而 不 是 me， 这 一 步 是 编译 属 目 动 帮 有 我们 做 的 。 不 论 这 个 方法 接受 的 
self 参 数 究竟 是 Self、&Self 还 是 &mut Self， 最 终 在 源码 上 ， 我 们 都 是 
统一 的 写法 : variable.method () 。 而 如 果 用 UFCS 语 法 来 调用 这 个 方 
法 ， 我 们 就 不 能 让 编译 器 帮 我 们 目 动 取 引 用 了 了， 必须 手动 写 清楚 。 


下 面 用 一 个 示例 演示 一 下 成 员 方法 和 普通 辑 数 其 实 没什么 本 质 区 


另 | 


别 


struct T(usize); 


impl T { 
fn geti(&self) -> usize {self.0} 


fn get2(&self) -> usize {self.0} 


fn get3(t: &T) -> usize { t.0 } 
fn check_type( _ : fn(&T)->usize ) {} 


fn main() { 
check_type(T::get1); 
check_type(T::get2); 
check_type(get3); 

} 


可 以 看 到 ，get1、get2 和 get3 都 可 以 自动 转 成 fn (&T) 一 usize 类 


型 


[© 


5.5 trait 约 束 和 继承 


Rnust 的 trait 的 另外 一 个 大 用 处 是 ， 作 为 泛 型 约束 使 用 。 天 于 泛 型 ， 
本 书 第 三 部 分 还 会 详细 解释 。 下 面 用 一 个 简单 示例 演示 一 下 trait 如 何 
作为 泛 型 约束 使 用 : 


use std::fmt::Debug; 


fn my_print<T : Debug>(x: T) { 
println!("The value is {:?}.", x); 
} 


fn main() { 
my_print("China"); 
my_print(41 i32); 
my_print(true),; 
my_print(['a', 'b', 'c']) 


上 面 这 段 代 码 中 ，my_print 函 数 引 入 了 一 个 泛 型 参数 T， 所 以 它 的 
参数 不 是 一 个 具体 类 型 ， 而 是 一 组 类 型 。 冒 号 后 面 加 trait 名 字 ， 就 是 
这 个 泛 型 参数 的 约束 条 件 。 它 要 求 这 个 T 类 型 实现 Debug 这 个 trait。 这 
是 因为 我 们 在 函数 体内 ， 用 到 了 printin! 格式 化 打印 ， 而 且 用 了 
, } 这 样 的 格式 控制 符 ， 它 要 求 类 型 满足 Debug 的 约束 ， 人 否则 编译 

\ 寺 “。 


在 调用 的 时 候 ， 凡 是 满足 Debug 约 束 的 类 型 都 可 以 是 这 个 函数 的 
参数 ， 所 以 我 们 可 以 看 到 以 上 四 种 调用 都 是 可 以 编译 通过 的 。 假 如 我 
们 目 定义 一 个 类 型 ， 而 它 没 有 实现 Debug trait， 我 们 整 会 发 现 ， 用 这 个 
类 型 作为 my_print 的 参数 的 话 ， 编 译 束 会 报错 。 


所 以 ， 沁 型 约束 既是 对 实现 部 分 的 约束 ， 也 十 对 调用 部 分 的 约 


〇 


泛 型 约束 还 有 另外 一 种 写法 ， 即 where 子 句 。 示 例如 下 : 


fn my_print<T>(x: T) where T: Debug { 
println!("The value is {:?}.", x); 


对 于 这 种 简单 的 情况 ， 两 种 写法 都 可 以 。 但 是 在 某 些 复杂 的 情况 
下 ， 泛 型 约束 只 有 where 于 名 可 以 表达 ， 沁 型 参数 后 面 直接 加 冒号 的 写 
法 表达 不 出 来 ， 比 如 涉及 关联 类 型 的 时 候 ， 请 参见 第 21 章 。 


trait 人 允许 继承 。 类 似 下 面 这 样 : 


trait Base { ... } 
trait Derived : Base { ... } 


这 表示 Derived trait 继 承 了 Base trait。 它 表达 的 意思 是 ， 满 足 
Derived 的 类 型 ， 必 然 也 满足 Base trait。 所 以 ， 我 们 在 针对 一 个 具体 类 
型 impl Derived 的 上 时候 ， 编 译 絮 也 会 要 求 我 们 同时 impl Base。 示 例如 


trait Base {} 

trait Derived : Base {} 
struct TT; 

impl Derived for T {0} 


fn main() { 


编译 ， 出 现 错误 ， 提 示 信 息 为 : 


--> test.rs:7:6 


| 
7 | impl Derived for T {0} 
| AAAAAAA the trait ‘Base is not implemented for °T. 


我 们 再 加 上 一 名 


impl Base for T {} 


编译 需 吏 不 再 报错 了 。 


实际 上 ， 在 编译 器 的 眼中 ，trait Derived: Basef} 等 同 于 trait 
Derived where Self: Base{}。 这 两 种 写法 没有 本 质 上 的 区 别 ， 都 是 给 
Derived 这 个 trait 加 了 一 个 约束 条 件 ， 即 实现 Derived trait 的 具体 类 型 ， 
也 必须 满足 Base trait 的 约束 。 


在 标准 库 中 ， 很 多 trait 之 间 都 有 继承 关系 ， 比 如 : 


trait Eq: PartialEq<Self> {} 

trait Copy: Clone {} 

trait Ord: Eq + PartialOrd<Self> {} 
trait FnMut<Args>: Fnonce<Args> {} 
trait Fn<Args>: FnMut<Args> {} 


读 完 本 书后 ， 读 者 应 该 能 够 理解 这 些 trait 是 用 来 做 什么 的 ， 以 及 
为 什么 这 些 trait 之 间 会 有 这 样 的 继承 关系 。 


5.6 Derive 


Rust 里 面 为 类 型 imp] 某 些 trait 的 时 候 ， 逻 辑 是 非常 机 械 化 的 。 为 许 
多 类 型 重复 而 单调 地 impl 某 些 trait， 是 非常 枯燥 的 事情 。 为 此 ，Rnust 提 
供 了 一 个 特殊 的 attribute， 它 可 以 大 有 我 们 目 动 impl 某 些 trait。 示 例如 
下 : 


#[derive(Copy, Clone, Default, Debug, Hash, PartialEq, Eq, PartialOrd, Ord)] 
struct Foo { 


data : i32 


} 

fn main() { 
let vi = Foo { data : 0 }; 
let v2 = v1; 
println!("{:?}", v2); 


如 上 所 示 ， 它 的 语法 是 ， 在 你 希望 impl trait 的 类 型 前 面 写 #[derive 
A 人- .) ]， 括 号 里 面 是 你 希望 impl 的 trait 的 名 字 。 这 样 写 了 之 后 ， 编 译 
器 训 才 你 自动 加 上 了 imnl 块 类 似 这 样 : 


impl Copy for Foo { ... } 
impl Clone for Foo { ... } 
impl Default for Foo { ... } 
impl Debug for Foo { ... } 
impl Hash for Foo { ... } 

impl PartialEq for Foo { ... } 


这 些 trait 都 是 标准 库 内 部 的 较 特 殊 的 trait， 它 们 可 能 包含 有 成 员 方 
法 ， 但 是 成 员 方 法 的 逻辑 有 一 个 简单 而 一 致 的 “模板 "可 以 使 用 ， 编 译 
妖 束 机 械 化 地 重复 这 个 模板 ， 帮 我 们 实现 这 个 默认 你 辑 。 当 然 我 们 也 
可 以 手动 实现 。 


目前 ，Rust 文 持 的 可 以 目 动 derive 的 trait 有 以 下 这 些 : 


Debug Clone Copy Hash RustcEncodable RustcDecodable PartialEeq Eq 
Parialord ord Default FrompPrimitive Send Sync 


5.7 trait 别 名 


跟 type alias 类 似 的 ，trait 也 可 以 起 别名 (trait alias) 。 假 如 在 某 些 
场景 下 ， 我 们 有 一 个 比较 复杂 的 trait: 


pub trait Service { 
type Request,; 
type Response; 
type Error,; 
type Future: Future<Item=Self::Response, Error=Self::Error>; 
fn call(&self, req: Self::Request) -> Self::Future; 


每 次 使 用 这 个 trait 的 时 候 都 需要 携带 一 堆 的 关联 类 型 参数 。 为 了 
在 已 经 确定 了 关联 类 型 的 场景 下 ， 我 们 可 以 为 它 取 
一 个 别名 ， 比 如 : 


trait HttpService = Service<Request = http::Request, 
Response = http::Response, 
Error = http::Error>,; 


5.8 标准 库 中 第 见 的 trait 催 介 


中 有 很 多 很 有 用 的 trait， 本 方 挑 几 个 特别 常见 的 给 大 家 介 


5.8.1 Display 和 Debug 
这 两 个 trait 在 标准 库 中 的 定义 是 这 样 的 : 


// std::fmt::Display 
pub trait Display { 
fn fmt(&self, f: &mut Formatter) -> Result<(), Error>; 


} 
// std::fmt::Debug 
pub trait Debug { 
fn fmt(&self, f: &mut Formatter) -> Result<(), Error>; 
} 


它们 的 主要 用 人 处 束 古 用 在 类 似 println! 这 样 的 地 方 : 


use std::fmt::{Display, Formatter, Error}; 


#[derive(Debug)] 
Struct T { 
field1i: i32, 
field2: i32, 
} 
impl Display for T { 


fn fmt(&self, f: &mut Formatter) -> Result<(), Error> { 
write!(f, "{{ field1i:{}, field2:{} }}", self.fieldi1i, self.field2) 
} 


} 


fn main() { 
let var = T { fieldi: 1, field2: 2 }; 
println!("{}", var); 
println!("{:?}", var); 
println!("{:#?}", var); 


只 有 实现 了 Display trait 的 类 型 ， 才 能 用 {} 格 式 控制 打印 出 来 ， 只 
有 实现 了 Debug trait 的 类 型 ， 才 能 用 {: ? }{: #2? } 格 式 控制 打印 出 


来 。 它 们 之 间 更 多 的 区 别 如 下 。 


.Display 假 定 了 这 个 类 型 可 以 用 utf-8 格 式 的 字符 串 表 示 ， 它 是 准备 
给 最 终 用 户 看 的 ， 并 不 是 所 有 类 型 都 应 该 或 者 能 够 实现 这 个 trait。 这 
个 trait 的 fmt 应 该 如 何 格 式 化 字符 串 ， 完 全 取决 于 程序 员 上 自己 ， 编 译 絮 
不 提供 自动 derive 的 功能 。 


:标准 库 中 还 有 一 个 常用 trait 叫 作 std: : string: : ToString， 对 于 
所 有 实现 了 Display trait 的 类 型 ， 都 目 动 实现 了 这 个 ToString trait。 它 包 
含 了 一 个 方法 to_string (&self) ->String。 任 何 一 个 实现 了 Display trait 


个 空 秘 


> 我 们 都 可 以 对 它 调用 to_string () 方法 格式 化 出 一 个 字符 


-Debug 则 十 主 要 为 了 调试 使 用 ， 建 议 所 有 的 作为 API 的 “公开 ?类 型 
都 应 该 实现 这 个 trait， 以 方便 调试 。 它 打印 出 来 的 字符 串 不 钙 以 “美观 
易 读 ”为 标准 ， 编 译 嚣 提供 了 目 动 derive 的 功能 。 


5.8.2 PartialOrd/Ord/PartialE.q/Eq 


在 前 文中 讲解 浮 点 类 型 的 时 候 提 到 ， 因 为 NaN 的 存在 ， 浮 点 数 是 
不 具备 “total order (全 序 关 系 ) ”的 。 在 这 里 ， 我 们 详细 讨论 一 下 什么 
是 全 序 、 什 么 是 偏 序 。Rust 标 准 库 中 有 如 下 解释 。 

对 于 集合 X 中 的 元 素 a，b，ec， 


.如 果 a<b 则 一 定 有 ! (a>b) ; 反之 ， 若 a>b， 则 一 定 有 ! 
(a<b) ， 称 为 反对 称 性 。 


:如果 a<b 且 b<c 则 a<c， 称 为 传递 性 。 
.对 于 X 中 的 所 有 元 素 ， 都 存在 a<b 或 a>b 或 者 a==b， 三 者 必 居 其 


一 ， 称 为 完全 性 
如 采集 合 X 中 的 元 素 只 具备 上 述 前 两 条 特征 ， 则 称 X 契 “ 偏 序 ”。 同 
时 具备 以 上 所 有 特征 ， 则 称 X 是 “全 序 ”。 


从 以 上 定义 可 以 看 出 ， 浮 点 数 不 具 备 “ 全 序 ” 特 征 ， 因 为 浮 点 数 中 
特殊 的 值 NaN 不 满足 完全 性 。 这 就 导致 了 一 个 问题 ， 浮 点 数 无 法 排 
. 0 个 不 是 NaN 的 数 和 NaN 之 间 做 比较 ， 无 法 分 出 先后 天 
有 ” 不 用 0 下 : 


fn main() { 
let nan = std::f32::NAN; 
let x = 1.0f32,; 
println!i("{}", nan < x); 
println!("{}", nan > x); 
println!i("{}", nan == x); 


以 上 不 论 是 NaN<x，NaN>xji 不 是 NaN==X， 结 果 都 是 false。 这 是 
IEEE754 标 准 中 规定 的 行为 。 


因此 ，Rnust 设 计 了 两 个 trait 来 描述 这 样 的 状态 : 一 个 是 std: 
cmp: : PartialOrd， 表 示 “ 偏 序 ”， 一 个 是 std: : cmp: : Ord， 表 
示 “ 全 序 ”。 它 们 的 对 外 接口 是 这 样 定义 的 : 


pub trait Partialord<Rhs: ?Sized = Self>: PartialEq<Rhs> { 
fn partial cmp(&self, other: &Rhs) -> Option<Ordering>; 


fn lt(&self, other: &Rhs) -> bool { //... } 
fn le(&self, other: &Rhs) -> bool { // } 
fn gt(&self, other: &Rhs) -> bool { //... } 
fn ge(&self, other: &Rhs) -> bool { //... } 


pub trait Ord: Eq + Partialord<Self> { 
fn cmp(&self, other: &Self) -> Ordering,; 


从 以 上 代码 可 以 看 出 ，partial_cmp 图 数 的 返回 值 类 型 是 
Option<Ordering>。 只 有 Ord trait 里 面 的 cmp 范 数 才 能 返回 一 个 确定 的 
Ordering。f32 和 f64 类 型 都 只 实现 了 PartialOrd， 而 没有 实现 Ord。 


因此 ， 如 采 我 们 写 出 下 面 的 代码 ， 编 译 闫 是 会 报错 的 : 


let int_vec = [1 i32, 2, 3]; 
let biggest_int = int_vec.iter().max(); 


let float vec = [1.0 f32, 2.0, 3.0]; 
let biggest float = float_ vec.iter().max(); 


对 整数 i32 类 型 的 数组 来 最 大 值 是 没 问 题 的 ， 但 是 对 浮 点 数 类 型 的 
数组 求 最 大 值 是 不 对 的 ， 编 译 错误 为 : 


the trait "core::cmp::ord' is not implemented for the type 'f32'" 


笔者 认为 ， 这 个 设计 是 优点 ， 而 不 是 缺点 ， 它 让 我 们 尽 可 能 地 在 
更 早 的 阶段 发 现 错误 ， 而 不 是 留 到 运行 时 再 去 debug。 假 如 说 编译 硕 无 
这 样 的 问题 ， 那 么 吏 可 能 发 生 下 面 的 情况 ， 以 Python 为 
列 . 


Python 3.4.2 (default, Oct 8 2014, 10:45:20) 

[GCC 4.9.1] on linux 

Type "help", "copyright", "credits" or "license" for more information. 
>>> v = [1.0, float("nan")] 

>>> max(v) 


>>> v = [float("nan"), 1.0] 
>>> max(v) 


上 面 这 个 示例 意味 着 ， 如 果 数 组 v 中 有 NaN， 对 它 求 最 大 值 ， 跟 数 
组 内 部 元 素 的 排列 顺序 有 关 。 


Rust 中 的 PartialOrd trait 实 际 上 就 是 Ct++20 中 即将 加 入 的 three-way 
comparison 运 算 符 <=>。 


同 理 ，PartialEqg 和 Eg 两 个 trait 也 就 可 以 理解 了 ， 它 们 的 作用 是 比较 
相等 关系 ， 与 排序 关系 非常 类 似 。 


5.8.3 Sized 


Sized trait 是 Rust 中 一 个 非常 重要 的 trait， 它 的 定义 如 下 : 


#[lang = "sized"] 
#[rustc_on_unimplemented = " {Self} does not have a constant size known at 
compile-time"] 
#[fundamental] // for Default, for example, which requires that ‘[T]: !Default. 
be evaluatable 
pub trait Sized { 
// Empty. 
} 


这 个 trait 定 义 在 std: : marker 模 块 中 ， 它 没有 任何 的 成 员 方 法 。 
它 有 #[lang="sized"] 属 性 ， 说 明 它 与 普通 trait 不 同 ， 编 译 占 对 它 有 特殊 
的 处 理 。 用 户 也 不 能 针对 目 己 的 类 型 impl 这 个 trait。 一 个 类 型 是 否 满足 
Sized 约 束 是 完全 由 编译 右 推 寻 的 ， 用 户 无 权 指 定 。 


我 们 知道 ， 在 C/C++ 这 一 类 的 语言 中 ， 大 部 分 变量 、 参 数 、 返 回 
值 都 应 该 是 编译 阶段 固定 大 小 的 。 在 Rust 中 ， 但 凡 编 译 阶段 能 确定 大 
小 的 类 型 ， 都 满足 Sized 约 束 。 那 还 有 什么 类 型 是 不 满足 Sized 约 束 的 
呢 ? 比如 C 语 言 里 的 不 定 长 数组 (Variable-length Array) 。 不 定 长 数组 
的 长 度 在 编译 阶段 是 未 知 的 ， 是 在 执行 阶段 才 确 定 下 来 的 。Rust 里 面 
也 有 类 似 的 类 型 [T]。 在 Rust 中 VLA 类 型 已 经 通过 了 RFC 设 计 ， 只 是 暂 
时 还 没有 实现 而 已 。 不 定 长 类 型 在 使 用 的 时 候 有 一 些 限制 ， 比 如 不 能 
用 它 作为 函数 的 返回 类 型 ， 而 必须 将 这 个 类 型 藏 到 指针 背后 才 可 以 。 
但 它 作 为 一 个 类 型 ， 依 然 是 有 意义 的 ， 我 们 可 以 为 它 添加 成 员 方 法 ， 
用 它 实例 化 泛 型 参数 ， 等 等 。 


Rust 中 对 于 动态 大 小 类 型 专门 有 一 个 名 词 Dynamic Sized Type。 我 
们 后 面 将 会 看 到 的 [T]，str 以 及 dyn Trait 都 是 DST。 


5.8.4 Default 


Rust 里 面 并 没有 C++ 里 面 的 “构造 琅 数 ”的 概念 。 大 家 可 以 看 到 ， 它 
只 提供 了 类 似 C 语 言 的 各 种 复合 类 型 各 目的 初始 化 语法 。 主 要 原因 在 
于 ， 相 比 普通 函数 ， 构 造 画 数 本 和 映 并 没有 提供 什么 额外 的 抽象 能 
所 以 Rust 里 面 推 荐 使 用 普通 的 静态 函数 作为 类 型 的 “构造 器 ”。 比 如 ， 
常见 的 标准 库 中 提供 的 字符 串 类 型 String， 它 包含 的 可 以 构造 新 的 
String 的 方法 不 完全 列举 都 有 这 么 多 : 


fn new() -> String 

fn with_capacity(capacity: usize) -> String 

fn from utf8(vec: Vec<u8>) -> Result<String, FromUtf8Error> 

fn from utf8_lossy<'a>(v: &'a [u8]) -> Cow<'a, str> 

fn from utf1i6(v: &[u16]) -> Result<String, FromUtf1i6Error> 

fn from utf16_ lossy(v: &[u16]) -> String 

unsafe fn from_raw_parts(buf: *mut u8, length: usize, capacity: usize) -> String 
unsafe fn from utf8_unchecked(bytes: Vec<u8>) -> String 


这 还 不 算 Default: : default () 、From: : from (s: &'astr) 、 
FromIte-r-a-t-or: : from iter<I: Intolterator<Item=char>> (iter: I) 、 
Iter-a-t-or: :collect 等 相对 复杂 的 构造 方法 。 这 些 方法 接受 的 参数 各 
异 ， 错 误 处 理 方式 也 各 异 ， 强 行将 它们 统一 到 同名 字 的 构造 印 数 重 载 
中 不 是 什么 好 主意 ( 沉 且 Rust 坚 决 反 对 ad hoc 式 的 函数 重 载 ) 。 


不 过 ， 对 于 那 种 无 参数 、 无 错误 处 理 的 简单 情况 ， 标 准 库 中 提供 
了 Default trait 来 做 这 个 统一 抽象 。 这 个 trait 的 签名 如 下 : 


trait Default { 
fn default() -> Self; 
} 


它 只 包含 一 个 “静态 函数 "default () 返回 Self 类 型 。 标 准 库 中 很 多 
类 型 都 实现 了 这 个 trait， 它 相当 于 提供 了 一 个 类 型 的 默认 值 。 


在 Rust 中 ， 单 词 new 并 不 是 一 个 关键 字 。 所 以 我 们 可 以 看 到 ， 很 多 
类 型 中 都 使 用 了 new 作 为 画 数 名 ， 用 于 命名 那 种 最 音 用 的 创建 新 对 象 
的 情况 。 因 为 这 些 new 函 数 差 别 甚 大， 所 以 并 没有 一 个 trait 来 对 这 些 
new 汞 数 做 一 个 统一 抽象 。 


5.9 总 结 

本 章 对 trait 这 个 概念 做 了 基本 的 介绍 。 除 了 上 面 介 绍 的 之 外 ，trait 
还 有 许多 用 处 : 

:trait 本 吴 可 以 携 市 泛 型 参数 ; 

:trait 可 以 用 在 泛 型 参数 的 约束 中 


-trait 可 以 为 一 组 类 型 impl， 也 可 以 单独 为 某 一 个 具体 类 型 impl， 而 
且 它 们 可 以 同时 存在 ; 


:trait 可 以 为 某 个 trait imp1， 而 不 是 为 某 个 具体 类 型 impl; 


:trait 可 以 包含 关联 类 型 ， 而 且 还 可 以 包含 类 型 构造 右 ， 实 现 高 阶 
类 型 的 某 些 功 能 ; 

-trait 可 以 实现 泛 型 代码 的 静态 分 派 ， 也 可 以 通过 trait object 实 现 动 
态 分 派 ; 

:trait 可 以 不 包含 任何 方法 ， 用 于 给 类 型 做 标签 (marker) ， 以 此 
来 描述 类 型 的 一 些 重要 特性 ; 

-trait 可 以 包含 常量 。 

trait 这 个 概念 在 Rust 语 言 扮演 了 非常 重要 的 角色 ， 承担 了 各 种 各 
样 的 功能 ， 在 写 代 码 的 时 候 会 经 常用 到 。 本 章 还 远 没 有 把 trait 相 关 的 


知识 讲解 完整 ， 更 多 关于 trait 的 内 容 ， 请 参阅 本 书后 文中 与 泛 型 、trait 
object 线 程 安全 有 关 的 章 了 站。 


第 6 章 ”数组 和 字符 串 
6.1 数组 


数组 是 一 个 容 磊 ， 它 在 一 块 连续 空间 内 存 中 ， 存 储 了 一 系列 的 同 
样 类 型 的 数据 。 数 组 中 元 素 的 占用 空间 大 小 必须 是 编译 期 确定 的 。 数 
组 本 吴 所 容纳 的 元 素 个 数 也 必须 是 编译 期 确定 的 ， 执 行 阶段 不 可 变 。 
如 果 需 要 使 用 变 长 的 容器 ， 可 以 使 用 标准 库 中 的 Vec/LinkedList 等 。 数 
组 类 型 的 表示 方式 为 [T; n]。 其 中 T 代 表 元 素 类 型 ，n 代 表 元 素 个 数 ; 
0 中 间 用 分 号 隅 开 。 下 面 看 一 个 基本 的 示 
[| . 


fn main() { 
// 定 长 数组 
let xs: [i32; 5] = [1, 2, 3, 4, 5]; 


// 所 有 的 元 素 , 如 果 初 始 化 为 同样 的 数据 , 可 以 使 用 如 下 语法 
let ys: [i32; 500] = [0; 500]; 
} 


在 Rust 中 ， 对 于 两 个 数组 类 型 ， 只 有 元 素 类 型 和 元 素 个 数 都 完全 
相同 ， 这 两 个 数组 才 坪 同类 型 的 。 数 组 与 指针 之 间 不 能 隐 式 转换 。 同 
类 型 的 数组 之 间 可 以 互相 赋值 。 示 例如 下 : 


fn main() { 


let mut xs: [i32; 5] = [1i, 2, 3, 4, 
let ys: [i32; 5] = [6, 7, 8, 9 


了 了 了 


xs = yS 
println!("new array {:?}", xs); 


把 数组 xs 作 为 参数 传 给 一 个 函数 ， 这 个 数组 并 不 会 退化 成 一 个 指 
针 。 而 是 会 将 这 个 数组 完整 复制 进 这 个 国 数 。 玉 数 体内 对 数组 的 改动 
不 会 影响 到 外 面 的 数组 。 


对 数组 内 部 元 素 的 访问 ， 可 以 使 用 中 括号 索引 的 方式 。Rust 文 持 
usize 类 型 的 索引 的 数组 ， 索 引 从 0 开始 计数 。 


fn main() { 
let v : [i32; 5] = [1,2,3,4,5]; 
let x = v[0] + v[1]; // 把 第 一 个 元 素 和 第 二 个 元 素 的 值 相 加 
println!("Sum is {}", x); 


} 


6.11 册 于 方法 


与 其 他 所 有 类 型 一 样 ，Rust 的 数组 类 型 拥有 一 些 内 置 方法 ， 可 以 
很 方便 地 完成 一 些 任务 。 比 如 ， 我 们 可 以 直接 实现 数组 的 比较 操作 ， 
只 要 它 包含 的 元 素 是 可 以 比较 的 : 


fn main() { 
let vi = [1, 2, 3]; 
let v2 = [1, 2, 4]; 
println!("{:?2}", vi < v2 ); 


我 们 也 可 以 对 数组 执行 志 历 操作 ， 如 : 


fn main() { 
let v = [0_ i32,; 10]; 


for i in &v { 
println!i("{:?}", 1); 


在 目前 的 标准 库 中 ， 数 组 本 号 没 有 实现 IntoIterator trait， 但 是 数组 
切片 是 实现 了 的 。 所 以 我 们 可 以 直接 在 for ip 循环 中 使 用 数组 切片 ， 而 
不 能 下 接 使 用 数组 本 喘 °。 更 详细 的 内 容 请 参阅 后 文中 关于 迭代 器 的 解 


释 。 
6.1.2 多维 数组 


既然 [T; n] 古 一 个 合法 的 类 型 ， 那 么 它 的 元 素 T 当 然 也 可 以 是 数组 
类 型 ， 因 此 [[T; m]; nj] 类 型 卓然 也 古 合 法 类 型 。 示 例如 下 : 


fn main() { 
let v : [[i32; 2]; 3] = [[9, 0], [9, ©], [9, 0]]; 


for i in &v { 
println!("{:?}", 1); 


6.1.3 ”数组 切片 


对 数组 取 借 用 borrow 操 作 ， 可 以 生成 一 个 “数组 切片 ”(Slice) 。 
数组 切片 对 数组 没有 “所 有 权 ”， 我 们 可 以 把 数组 切片 看 作 专 门 用 于 指 
问 数 组 的 指针 ， 是 对 数组 的 另外 一 个 “视图 ”。 比 如 ， 我 们 有 一 个 数组 
[T; m]， 它 的 借用 指针 的 类 型 惑 是 &[T; nm 。 它 可 以 通过 编译 器 内 部 魔 
法 转换 为 数组 切片 类 型 &[T]。 数 组 切 斤 实 质 上 还 是 指针 ， 它 不 过 是 在 
类 型 系统 中 丢弃 了 编译 阶段 定 长 数组 类 型 的 长 度 信息 ， 而 将 此 长 度 信 
恩人 存储 为 运行 期 的 值 。 示 例如 下 : 


fn main() { 
fn mut_array(a : &mut [i32]) { 
a[2] = 5; 


println!("size of &[i32; 3] : {:?}", std::mem::size of::<&[i32; 3]>()); 
println!("size of &[i32] : {:?}", std::mem::size of::<&[i32]>()); 
let mut v : [i32; 3] = [1,2,3]; 


let s : &mut [i32; 3] = &mut v,; 
mut_array(s); 


} 
println!("{:?}", VvV); 


变量 v 是 [i32; 3] 类 型 ， 变 量 s 是 &mnut[i32; 3] 类 型 ， 占 用 的 空间 大 
小 与 指针 相同 。 它 可 以 自动 转换 为 &mnut[i32] 数 组 切片 类 型 传 入 函数 
mut_array， 占 用 的 空间 大 小 等 于 两 个 指针 的 空间 大 小 。 通 过 这 个 指 
针 ， 在 函数 内 部 ， 修 改 了 外 部 的 数组 v 的 值 。 


6.1.4 DST 和 胖 指 针 


从 前 面 的 示例 中 可 以 看 到 ， 数 组 切片 是 指 回 一 个 数组 的 指针 ， 而 
它 比 指针 又 多 了 一 点 东西 一 一 它 不 止 包含 有 一 个 指 癌 数 组 的 指针 ， 切 
片 本 身 还 合 带 长 度 信息 。 


Slice 与 普通 的 指针 是 不 同 的 ， 它 有 一 个 非常 形象 的 名 字 : 胖 指 针 

(fat pointer) 。 与 这 个 概念 相对 应 的 概念 是 “动态 大 小 类 
型 ”Dynamic Sized Type，DST) 。 所 谓 的 DST 指 的 是 编译 阶段 无 法 
占用 空间 大 小 的 类 型 。 为 了 安全 性 ， 指 加 DST 的 指针 一 般 是 胖 指 


比如 : 对 于 不 定 长 数组 类 型 [T]， 有 对 应 的 腾 指 针 &[T] 类 型 ， 对 于 
不 定 长 字符 串 str 类 型 ， 有 对 应 的 胖 指 针 &str 类 型 ， 以 及 在 后 文中 会 出 
现 的 Trait Object; 等 等 。 


由 于 不 定 长 数组 类 型 [T] 在 编译 阶段 是 无 法 判断 该 类 型 占用 空间 的 
大 小 的 ， 目 前 我 们 不 能 在 栈 上 声明 一 个 不 定 长 大 小 数组 的 变量 实例 ， 
也 不 能 用 它 作 为 函数 的 参数 、 返 回 值 。 但 是 ， 指 向 不 定 长 数组 的 胖 指 
ep &[T] 类 型 可 以 用 做 变量 实例 、 函 数 参数 、 返 回 


通过 前 面 的 示例 我 们 可 以 看 到 ，&[T] 类 型 占用 了 两 个 指针 大 小 的 
J 间 。 我 们 可 以 利用 unsafe 代 码 把 这 个 胖 指 针 内 部 的 数据 打印 出 


fn raw_slice(arr: &[i32]) { 
unsafe 区 
let (vali, val2) : (usize, usize) = std::mem::transmute(arr); 
println!("Value in raw pointer:"); 
println!("value1: {:x}", vall1); 
println!("value2: {:x}", val2); 


} 

fn main() { 
let arr : [i32; 5] = [1, 2, 3, 4, 5]; 
let address : &[i32; 5] = &arr,; 
println!("Address of arr: {:p}", address); 
raw_slice(address as &[i32]); 

} 


在 这 个 示例 中 ， 我 们 arr 是 长 度 为 5 的 让 2 类 型 的 数组 。address 是 一 
个 普通 的 指 癌 arr 的 借用 指针 。 我 们 可 以 用 as 关键 字 把 address 转 换 为 一 


个 胖 指针 &[i32]， 并 传递 给 raw_slice 函 数 。 在 raw_slice 函 数 内 部 ， 我 们 
利用 了 unsafe 的 transmnute 函 数 。 我 们 可 以 把 它 看 作 一 个 强制 类 型 转 

换 ， 类 似 reinterpret _cast， 通 过 这 个 函数 ， 我 们 把 胖 指 针 的 内 部 数据 转 
换 成 了 两 个 usize 大 小 的 整数 来 看 待 。 编 译 ， 执 行 ， 结 采 为 : 


$ ./test 

Address of arr: Oxe2e236f6cc 
Value in raw pointer: 
Value1: e2e236f6cc 

Value2: 5 


由 此 可 见 ， 胖 指针 内 部 的 数据 既 包 含 了 指向 源 数组 的 地 址 ， 又 包 
含 了 该 切片 的 长 度 。 


对 于 DST 类 型 ，Rust 有 如 下 限制 : 


:只 能 通过 指针 来 间接 创建 和 操作 DST 类 型 ，&[T]Box<[T]> 可 以 ， 
[T] 不 可 以 ; 


:局 部 变量 和 函数 参数 的 类 型 不 能 是 DST 类 型 ， 因 为 局 部 变量 和 夯 
数 参 数 必须 在 编译 阶段 知道 它 的 大 小 因为 目前 unsized rvalue 功 能 还 没 
有 实现 ; 


:enum 中 不 能 包含 DST 类 型 ，struct 中 只 有 最 后 个 元 素 可 以 古 
DST， 其 他 地 方 不 行 ， 如 果 包 含有 DST 类 型 ， 那 么 这 个 结构 体 也 就 成 
了 DST 类 型 。 


Rust 设 计 出 DST 类 型 ， 使 得 类 型 暂时 系统 更 完善 ， 也 有 助 于 消除 
一 些 C/C++ 中 容易 出 现 的 bug。 这 一 设计 的 好 处 有 : 

- 目 完 ，DST 类 型 虽然 有 一 些 限制 条 件 ， 但 我 们 依然 可 以 把 它 当 成 
合法 的 类 型 看 待 ， 比 如 ， 可 以 为 这 样 的 类 型 实现 trait、 添 加 方法 、 用 
在 泛 型 参数 中 等 ; 


: 胖 指 针 的 设计 ， 避 免 了 数组 类 型 作为 参数 传递 时 目 动 退化 为 保 指 
针 类 型 ， 丢失 了 长 度 信息 的 问题 ， 你 证 了 类 型 安全 ; 


:这 一 设计 依然 保持 了 与 “所 有 权 ”“ 生 命 周 期 "等 概念 相 容 的 特点 。 


数组 切片 不 从 十 提供 了 "数组 到 指 针 ” 的 安全 转换 ， 配 合 上 Range 功 
能 ， 它 还 能 提供 数组 的 局 部 切片 功能 。 


6.1.5 Range 


Rust 中 的 Range 代 表 一 个 “区 间 ”， 一 个 “范围 >， 它 有 内 置 的 语法 文 
持 ， 束 是 两 个 小 数 点 ..。 示 例如 下 : 


fn main() { 
let r = 1..10;  // r 是 一 个 Range<i32>, 中 间 是 两 个 点 , 代表 [1, 10) 这 个 区 间 
for i in rt 
print!("{:?2}\t", 1); 


编译 ， 执 行 ， 结 果 为 ， 


./test 


片 护 


需要 注意 的 是 ， 在 begin..end 这 个 语法 中 ， 前 面 是 闭 区 间 ， 后 面 是 
开 区 间 。 8 这 个 语法 实际 上 生成 的 古 一 了 std: : Oops: : Range<_> 类 型 
的 变量 。 该 类 型 在 标准 库 中 的 定义 如 下 : 


pub struct Range<Idx> { 
/// The lower bound of the range (inclusive). 
pub start: Idx, 
/// The upper bound of the range (exclusive). 
pub end: Idx, 


所 以 ， 上 面 那 段 示 例 代 码 实质 上 等 同 于 下 面 这 上段 代码 : 


use std::ops::Range; 


fn main() { 
let r = Range {start: 1, end: 10}; // rr 是 一 个 Range<i32> 
for i in rt 
print!("{:?2}\t", 1); 
} 


} 


两 个 小 数 点 的 语法 仅仅 是 一 个 “语法 糖 ?而 已 ， 用 它 构 造 出 来 的 变 


量 古 Range 类 型 。 


这 个 类 型 本 身 实 现 了 Iterator trait， 因 此 它 可 以 直接 应 用 到 循环 语 
句 中 。Range 具 有 迭代 需 的 全 部 功能 ， 因 此 它 能 调用 迭代 器 的 成 员 方 
法 。 比 如 ， 我 们 要 实现 从 100 递 减 到 10， 中 间 间 隔 为 10 的 序列 ， 可 以 这 
么 做 〈 具 体 语法 请 参考 后 文中 的 迭代 器 、 闭 包 等 章节 ) : 


fn main() { 

use std::iter::Iterator; 

// 先 用 rev 方 法 把 这 个 区 间 反 过 来 ,然后 用 map 方 法 把 每 个 元 素 乘 以 10 
let r = (1i32..11).rev().map(|i| i * 10); 


for i inr 
print!("{:?2}\t", 1); 


执行 结果 为 : 


$ ./test 
100 90 80 70 60 50 40 30 20 10 


在 Rust 中 ， 还 有 其 他 的 几 种 Range， 包 括 
'Std: : ops: : RangeFrom 代 表 只 有 起 始 没 有 结束 的 范围 ， 语 法 为 


start..， 含 义 是 [start，+00) ; 

:std: : ops: : RangeTo 代 表 没 有 起 始 只 有 结束 的 范围 ， 语 法 
为 .end， 对 有 符号 数 的 含义 是 (-%，end) ， 对 无 符号 数 的 含义 是 [0， 
end) ; 

std: : ops: : RangeFull 代 表 没 有 上 下 限制 的 范围 ， 语 法 为 ..， 对 
有 符号 数 的 含义 是 〈-oo，+oco) ， 对 无 符号 数 的 含义 是 [0，+ceo) 。 
六 数组 和 Range 之 则 最 常用 的 配合 就 是 使 用 Range 进 行 索引 操作 。 示 
列 如 下 : 


fn print_slice(arr: &[i32]) { 
println!("Length: {}", arr.len()); 


for item in arr { 
print!("{}\t", item),; 


} 
println!(""); 


fn main() { 


let arr : [i32; 5] = [1, 2, 3, 4, 5]; 
print_slice(&arr[..]); // full range 
let slice = &arr[2..]; // RangeFrom 


print_slice(slice),; 


let slice2 = &slice[..2]; // RangeTo 
print_slice(slice2); 


编译 ， 执 行 ， 结 来 为 : 


Length: 5 

于 2 3 4 5 
Length: 3 

3 4 5 

Length: 2 

3 4 


第 一 次 打印 ， 内 容 为 整个 arr 的 所 有 区 间 。 第 二 次 打印 ， 是 从 arr 的 
index 为 2 的 元 素 开 始 算 起 ， 一 直到 最 后 。 注 意 数 组 是 从 index 为 0 开始 计 
~ 是 从 slice 的 头 部 开始 ， 长 度 为 2， 因 此 只 打印 出 了 
3、4 两 个 数字 。 


在 许多 时 候 ， 使 用 数组 的 一 部 分 切片 作为 被 操作 对 象 在 画 数 间 传 
递 ， 既 保证 了 效率 (避免 直接 复制 大 数组 ) ， 又 能 保证 将 所 需要 执行 
的 操作 限制 在 一 个 可 控制 的 范围 内 〈《 有 长 度 信息 ， 有 越界 检查 ) ， 还 
能 控制 其 读 写 权 限 ， 非 常 有 用 。 


虽然 左 闭 右 开 区 间 是 最 常用 的 写法 ， 人 然而， 在 有 些 情 况 下 ， 这 种 
语法 不 足以 处 理 边界 问题 。 比 如 ， 我 们 希望 产生 一 个 i32 类 型 的 从 0 到 
i32: : MAX 的 范围 ， 就 无 法 表示 。 因 为 按 语法 ， 我 们 应 该 写 0.. 

(i32: : MAX+1) ， 然 而 (i32: : MAX+1) 已 经 溢出 了 。 所 以 ， 
Rust 还 提供 了 一 种 左 闭 右 闭 区 间 的 语法 ， 它 使 用 这 种 语法 来 表示 ..=。 


闭 区 间 对 应 的 标准 库 中 的 类 型 是 : 


std: : ops: : RangeInclusive， 语 法 为 start..=end， 含 义 是 [start,， 
end]。 


std: : ops: : RangeToInclusive， 语 法 为 .=end， 对 有 符号 数 的 
含义 是 -oo，end]， 对 无 符号 数 的 舍 义 是 [0，end] 


6.1.6 ”边界 检查 


在 前 面 的 示例 中 ， 我 们 的 “索引 ”都 是 一 个 合法 的 值 ， 没 有 超过 数 
组 的 长 度 。 如 采 我 们 给 "索引 "一 个 非法 的 值 会 怎样 呢 : 


fn main() { 
let v = [10i32, 20, 30, 40, 50]; 
let index : usize =std :: env :: args(). nth(1). 
map(|x|x.parse().unwrap_or(0)).unwrap_or(0); 
println!("{:?}", v[index]); 


编译 通过 ， 执 行 thread'main'panicked atindex out of bounds: the len 
is 5 but the index is 10'。 可 以 看 出 ， 如 果 用 /test 10， 则 会 出 现 数 组 越 
界 ，Rust 目 前 还 无 法 任意 索引 执行 编译 阶段 边界 检查 ， 但 是 在 运行 阶 
段 执行 了 边界 检查 。 下 面 我 们 分 析 一 下 边界 检查 背后 的 故事 。 


在 Rust 中 , “索引 ”操作 也 是 一 个 通用 的 运算 符 ， 是 可 以 目 行 扩展 
的 。 如 果 硕 望 某 个 类 型 可 以 执行 “索引 ”? 读 操作 ， 怠 需要 该 类 型 实现 
std: : ops: : Index trait， 如 有 果 希 望 某 个 类 型 可 以 执行 “索引 ” 写 操 
作 ， 就 需要 该 类 型 实现 std: : ops: : IndexMut trait。 


对 于 数组 类 型 ， 如 有 宁 使 用 usize 作 为 索引 类 型 执行 读 取 操 作 ， 实 际 
执行 的 是 标准 库 中 的 以 下 代码 : 


impl<T> ops::Index<usize> for [T] { 
type Output = T; 


fn index(&self, index: usize) -> &T { 
assert!(index < self.1len()); 
unsafe { self.get_unchecked(index) } 
} 
} 


代码 中 使 用 的 assert! 宏 定义 在 libcore/macros.rs 中 ， 产 人 码 是 这 样 


macro_rules! assert { 
($cond:expr) => ( 
If !$cond { 
panic!(concat!("assertion failed: ", stringify!($cond))) 


); 
($cond:expr, $($arg:tt)+) => ( 
if !$cond 
panic!($($arg)+) 


也 丈 是 说 ， 如 有 果 index 超 过 了 数组 的 真实 长 度 范 围 ， 会 执行 panic ! 
J 导致 线程 abort。 使 用 Range 等 类 型 做 Index 操 作 的 执行 流程 与 此 
以 。 


为 了 防止 索引 操作 导致 程序 朋 社 ， 如 果 我 们 不 确定 使 用 的 “ 索 
引 ”* 是 否 合法 ， 应 该 使 用 get () 方法 调用 来 获取 数组 中 的 元 素 ， 这 个 
方法 不 会 引起 panic! ， 它 的 返回 类 型 是 Option<T>， 示 例如 下 : 


fn main() { 
let v = [10i32, 20, 30, 40, 50]; 
let first = v.get(0); 
let tenth = v.get(10); 
println!("{:?} {:?}", first, tenth); 
} 


输出 结果 为 : “Some (10) None”。 


Rust 宣 称 的 优点 是 “无 GC 的 内 存 安 全 ”， 那 么 数组 越界 会 直接 导致 
程序 月 并 这 件 事情 是 否 意 味 着 Rust 不 够 安全 呢 ? 不 能 这 么 理解 。Rust 
保证 的 “内 存 安全 ”"， 并 非 意 味 厦 “ 永 不 月 溃 ”。Rust 中 关于 数组 越界 的 
行为 ， 定 义 得 非常 清晰 。 相 比 于 C/C++，Rust 消 除 的 是 “未 定义 行 
为 ”(Undefined Behaviour) 。 


对 于 明显 的 数组 越界 行为 ， 在 Rust 中 可 以 通过 lint 检 查 来 发 现 。 大 
家 可 以 参考 “clippy” 这 个 项 目 ， 它 可 以 检查 出 这 种 明显 的 当量 索引 越界 


的 现象 。 然 而 ， 总 体 来 说 ， 在 Rust 里 面 ， 靠 编译 阶段 静态 检查 是 无 法 
消除 数组 越 界 的 行为 的 。 


一 般 情 况 下 ，Rust 不 发 励 大 量 使 用 “索引 ”操作 。 正 常 的 “索引 ” 操 
作 都 会 执行 一 次 “边界 检查 *”。 从 执行 效率 上 来 说 ，Rust 比 C/C++ 的 数组 
索引 效率 低 一 点 ， 因 为 C/C++ 的 索引 操作 是 不 执行 任何 安全 性 检查 
的 ， 它 们 对 应 的 Rust 代 码 相当 于 调用 get_unchecked () 琅 数 。 在 Rust 
中 ， 更 加 地 道 的 做 法 是 尽量 使 用 “迭代 句 ” 方 法 。“ 迭 代 器 ”非常 重要 ， 
人 下 面 是 使 用 迭代 器 操作 数组 的 一 些 简 
不 饮 : 


fn main() { 
use std::iter::Iterator,; 


let v = &[10i32, 20, 30, 40, 50]; 


// 如 果 我 们 同时 需要 ijndex 和 内 部 元 素 的 值 , 调用 enumerate( ) 方 法 
for (index, value) in v.iter().enumerate() { 
println!("{} {}", index, value); 


} 


// filter 方 法 可 以 执行 过 滤 , nth 画 数 可 以 获取 第 n 个 元 素 
let item = v.iter().filter(|&x| *x % 2 == 0).nth(2); 
println!("{:?}", item); 


Iterator 还 有 许多 有 用 的 方法 ， 合 理 地 组 合 使 用 它们 ， 能 使 程序 表 
达能 力 强 ， 可 读 性 好 ， 安 全 高 效 ， 可 以 满足 我 们 绝 大 多 数 的 需求 。 


6.2 ”字符 串 


字符 囊 是 非常 重要 的 常见 类 型 。 相 比 其 他 很 多 语言 ，Rust 的 字符 
显得 有 点 复杂 ， 主 要 是 跟 所 有 权 有 关 。Rnust 的 字符 串 涉 及 两 种 类 


型 ， 一 种 是 &str， 必 外 一 种 是 String 。 


6.2.1 Q&str 


str 是 Rust 的 内 置 类 型 。&str 是 对 str 的 借用 。Rnust 的 字符 串 内 部 默认 
是 使 用 utf-8 编 码 格式 的 。 而 内 置 的 char 类 型 是 4 字 节 长 度 的 ， 存 储 的 内 
容 是 Unicode Scalar Value。 所 以 ，Rust 里 面 的 字符 串 不 能 视 为 char 类 型 
的 数组 ， 而 更 接近 u8 类 型 的 数组 。 实 际 上 str 类 型 有 一 种 方法 : fn as_ptr 
， ->*const u8。 它 内 部 无 须 做 任何 计算 ， 只 需 做 一 个 强制 类 型 
Hj: 


self as *const str as *const u8 


这 样 设 计 有 一 个 缺点 ， 就 是 不 能 支持 O (1) 时 间 复 洒 度 的 索引 操 
作 。 如 采 我 们 要 找 一 个 字符 串 s 内 部 的 第 n 个 字符 ， 不 能 直接 通过 s[n] 得 
到 ， 这 一 点 跟 其 他 许多 语言 不 一 样 。 在 Rust 中 ， 这 样 的 需求 可 以 通过 
下 面 的 语句 实现 : 


s.chars().nth(n) 


它 的 时 间 复 杂 度 是 O (n) ， 因 为 utf-8 是 变 长 编码 ， 如 果 我 们 不 从 
头 开始 过 一 再 ， 根 本 不 知道 第 n 个 字符 的 地 址 在 什么 地 方 。 


但 是 ， 综 合 来 看 ， 选 择 utf-8 作 为 内 部 默认 编码 格式 是 缺陷 最 少 的 
一 种 方式 了 。 相 比 其 他 的 编码 格式 ， 它 有 相当 多 的 优点 。 比 如 : 它 是 
大 小 端 无 天 的 ， 它 跟 ASCII 码 兼容 ， 它 是 互联 网 上 的 首选 编码 ， 等 
ne 的 详细 优 劣 对 比 ， 强 烈 建议 大 家 参考 下 面 
J | 区 站 : 


http://utf8everywhere.org/ 


跟 上 一 章 讲 过 的 数组 类 似 ，[T] 是 DST 类 型 ， 对 应 的 str 是 DST 类 
。&[T] 是 数组 切片 类 型 ， 对 应 的 &str 是 字符 串 切 片 类 型 。 示 例如 


fn main() { 
let greeting : &str = "Hello"; 
let substr : &str = &greeting[2..]; 
println!("{}", substr); 


编译 ， 执 行 ， 可 见 它 跟 数组 切片 的 行为 很 相似 。 
&str 类 型 也 是 一 个 胖 指针 ， 可 以 用 下 面 的 示例 证 明 : 


fn main() { 
println!("Size of pointer: {}", std::mem::size of::<*const ()>()); 
println!("Size of &str : {}", Std::mem::size of::<&str>()); 


编译 ， 执 行 ， 结 果 为 : 


Size of pointer: 8 
Size of &str : 16 


它 内 部 实际 上 包含 了 一 个 指 回 字符 串 片 段 头 部 的 指针 和 一 个 长 
度 。 所 以 ， 它 跟 C/C++ 的 字符 串 不 同 : C/C++ 里 面 的 字符 串 以 \0' 结 
尾 ， 而 Rust 的 字符 串 是 可 以 中 间 包 含 \0' 字 符 的 。 


6.2.2 String 


接 下 来 讲 String 类 型 。 它 跟 &str 类 型 的 主要 区 别 是 ， 它 有 管理 内 存 
空间 的 权力 。 关 于 “所 有 权 ” 和 “借用 ”的 关系 ， 在 本 书 第 二 部 分 会 详细 
讲解 。&str 类 型 是 对 一 块 字符 串 区 则 的 借用 ， 它 对 所 指 同 的 内 存 空间 
没有 所 有 权 ， 哪 怕 &maut str 也 一 样 。 比 如 : 


let greeting : &str = "Hello"; 


我 们 没 办 法 扩大 greeting 所 引用 的 范围 ， 在 它 后 面 增加 内 容 。 但 是 
String 类 型 可 以 。 示 例如 下 : 


fn main() { 
let mut s = String::from("Hello"); 
s.push(' '); 
s.push_str("World."),; 
println!("{}", s); 


这 征 因 为 String 类 型 在 堆 上 动态 申请 了 一 块 内 存 空间 ， 它 有 权 对 这 
块 内 存 空间 进行 扩容 ， 内 部 实现 类 似 于 std: : Vec<u8> 类 型 。 所 以 我 
们 可 以 把 这 个 类 型 作为 容纳 子 符 串 的 容器 使 用 。 


这 个 类 型 实现 了 Deref<Target=str> 的 trait。 所 以 在 很 多 情况 下 ， 
&String 类 型 可 以 被 编译 事 目 动 转换 为 &str 类 型 。 关 于 Deref 大 家 可 以 参 
考 本 书 第 二 部 分 “ 解 引用 ”章节 。 我 们 写 个 小 示例 演示 一 下 : 


fn capitalize(substr: &mut str) { 
substr.make_ascii uppercase(); 


} 


fn main() { 
let mut s = String::from("Hello World"); 
capitalize(&mut s); 
println!("{}", s); 

} 


在 这 个 例子 中 ，capitalize 丽 数 调用 的 时 候 ， 形 式 参数 要 求 是 &mut 
st 类 型 ， 而 实际 参数 是 &mut String 类 型 ， 这 里 编译 器 给 我 们 做 了 自动 
类 型 转换 。 在 capitalize 画 数 内 部 ， 它 有 权 修 改 &mut str 所 指向 的 内 容 ， 
但 是 无 权 给 这 个 字符 串 扩容 或 者 释放 内 存 。 


Rnust 的 内 存 管 理 方式 和 C++ 有 很 大 的 相似 之 处 。 如 宁 用 C++ 来 对 
比 ，Rust 的 String 类 型 类 似 于 std: : string， 而 Rust 的 &str 类 型 类 似 于 
std: : string_view“。 示 例如 下 : 


#include <iostream> 
#include <string> 


#include <string_view> 

int main() { 
std::string s = "Hello world"; 
std::string_view v(&s[5], 5); 


std::cout << "Size of string view:" << Sizeof(vV) << "\n" 
<< "Value: " << V << std::endl,; 


这 样 的 对 比 可 能 会 让 有 C++ 背 景 的 读者 更 容易 理解 一 些 
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第 7 章 ”模式 解构 
7.1 简介 


“Pattern Destructure” 是 Rust 中 一 个 重要 且 实 用 的 设计 。 笔 者 暂且 将 
其 翻译 为 “模式 解构 ”。 注 意 这 里 的 *Destructure” 和 “Destructor" 是 完全 
不 同 的 两 个 单词 ， 代 表 完 全 不 同 的 含义 。“Destructure” 的 意思 是 把 原 
来 的 结构 胶 解 为 单独 的 、 局 部 的 、 原 始 的 部 分 ; “Destructor”" 是 指 “ 析 
构 恬 ”， 是 一 个 与 “构造 器 ”相对 应 的 概念 ， 是 在 对 象 被 销毁 的 时 候 调 用 


下 面 举 例 说 明 什么 是 模式 解构 : 


let tuple = (1 i32, false, 3f32); 
let (head, center, tail) = tuple; 


以 上 的 第 二 句 代码 就 是 一 个 典型 的 “模式 解构 ”。 我 们 可 以 这 么 理 
解 ， 第 一 句 话 是 “构造 >， 它 把 三 个 元 素 组 合 到 了 一 起 ， 形 成 了 一 个 
tuple。 而 第 二 名 代码 则 是 刚好 反 过 来 ， 把 一 个 组 合 数据 结构 ， 拆 解 开 
来 ， 分 成 了 三 个 不 同 的 变量 。 在 let 语 句 中 ， 赋 值 号 左边 的 内 容 就 是 本 
节 中 我 们 所 说 的 “模式 ”， 赋 值 号 右边 的 内 容 就 是 我 们 需要 被 “解构 ”的 
内 容 。 这 个 “模式 ”中 引入 了 三 个 新 的 变量 head、center 、 tail， 它 们 分 别 
绑 定 了 这 个 tuple 的 三 个 成 员 。 


Rust 中 模式 解构 功能 设计 得 非常 美观 ， 它 的 原则 是 :构造 和 解构 
遵循 类 似 的 语法 ， 我 们 怎么 把 一 个 数据 结构 组 合 起 来 的 ， 我 们 束 坚 么 
把 它 拆 解 开 来 。 为 了 更 好 地 说 明 这 个 问题 ， 我 们 再 来 看 一 个 更 复 洒 一 
点 的 例子 。 比 如 ， 我 们 有 一 个 struct， 里 面包 含 男 外 一 个 struct 类 型 : 


struct T1 (i32, char); 


struct T2 { 
item1i: T1, 
item2: bool, 


} 


fn main() 


let X = T2 1{ 
Item1: T1i(0, 'A'), 
item2: false, 


}; 


let T2 { 
itemi: Ti(valuei1, value2), 
item2: value3, 

} = X/ 


println!("{} {} {}", value1, value2, value3); 


如 前 所 述 ， 我 们 首先 构造 了 一 个 T2 类 型 的 变量 x， 它 内 部 义 藤 套 
包含 了 其 他 的 结构 体 。 实 际 上 ， 我 们 完全 可 以 一 次 性 解构 多 个 层次 ， 
直接 把 这 个 对 象 内 部 深 处 的 元 素 拆 解 出 来 。 第 二 条 ]et 语 句 ， 就 是 一 个 
比较 复杂 的 “模式 解构 ”， 赋 值 号 的 左边 不 仅仅 是 一 个 变量 名 ， 还 是 一 
个 完整 的 “模式 ”， 在 这 个 模式 中 引入 了 三 个 变量 valuel1、value2、 
value3， 分 别 绑 定 到 了 item1 内 部 的 两 个 成 员 以 及 item2 上。 


编译 ， 执 行 ， 打 印 出 来 的 结果 为 "0 A false"。 
Rust 的 “模式 解构 ”功能 不 仅 出 现在 let 语 名 中， 还 可 以 出 现在 


match、if let、while let、 范 数 调 用 、 闭 包 调 用 等 情景 中 。 而 match 具 有 
功能 最 强大 的 模式 匹配 。 下 面 首先 介绍 match 语 法 。 


7.2 match 
首先 ， 我 们 看 看 使 用 match 的 最 简单 的 示例 : 


enum Direction { 
East, West, South, North 


fn print(x: Direction) 
match x { 


Direction::East => { 
println!("East"); 


Direction::West => { 
println! ("West"); 


Direction::South => { 
println!("South"); 


Direction::North => { 
println!("North"); 


} 
} 


fn main() { 


Jet x = Direction::East,; 
print(x); 


当 一 个 类 型 有 多 种 取 值 可 能 性 的 时 候 ， 特 别 适合 使 用 match 表 达 
式 。 对 于 这 个 示例 ， 我 们 也 可 以 用 多 个 if-else 表 达 式 完成 类 似 的 功能 ， 
但 是 match 表 达 式 还 有 更 强大 的 功能 ， 下 面 我 们 继续 说 明 。 


7.2.1 exhaustive 


如 果 我 们 把 上 例 中 的 Direction: : North 对 应 的 分 支 删 除 : 


match x { 
Direction::East => { 
println!("East"); 


Direction::West => { 
println!("West"); 


Direction::South => { 
println!("South"); 
} 
} 


编译 ， 出 现 了 编译 错误 : 


error[E0004]: non-exhaustive patterns: ‘North. not covered 


这 是 因为 Rust 要 求 match 需 要 对 所 有 情况 做 完整 的 、 无 遗漏 的 匹 
配 ， 如 果 漏 掉 了 某 些 情况 ， 是 不 能 编译 通过 的 。exhaustive 意 思 是 无 遗 
疾风 、 穷尽 的 、 彻 底 的 、 全 面 的 。exhaustive 是 Rust 模 式 匹 配 的 重要 特 


有 些 时 候 我 们 不 想 把 每 种 情况 一 一 列 出 ， 可 以 用 一 个 下 划 线 来 表 
达 “ 除 了 列 出 来 的 那些 之 外 的 其 他 情况 ”: 


match x { 
Direction::East => { 
println!("East"); 


Direction::West => { 
println!("West"); 


Direction::South => { 
println!("South"); 


二 > 


{ 
println!("Other"); 


正 因 为 如 此 ， 在 多 个 项 目 之 间 有 依赖 关系 的 时 候 ， 在 上 游 的 一 个 
库 中 对 enum 增 加 成 员 ， 是 一 个 破坏 兼容 性 的 改动 。 因 为 增加 成 员 后 ， 
很 可 能 会 导致 下 游 的 使 用 者 match 语 名 编译 不 过 。 为 解决 这 个 问题 ， 
人 作 non_exhaustive 的 功能 〈 目 前 还 没有 稳定 ) 。 示 例 
中: 


#[non_exhaustivel] 

pub enum Error { 
NotFound, 
PermissionDenied, 
ConnectionRefused, 


} 


上 游 座 作者 可 以 用 一 个 叫 作 “non_exhaustive” 的 attribute 来 标记 一 个 
enum 或 者 struct， 这 样 在 另外 一 个 项 目 中 使 用 这 个 类 型 的 时 候 ， 无 论 如 
何 都 没 办 法 在 match 表 达 式 中 通过 列举 所 有 的 成 员 实现 完整 匹配 ， 必 须 
使 用 下 划 线 才能 完成 编译 。 这 样 ， 以 后 上 游 库 里 面 为 这 个 类 型 添加 新 
成 员 的 时 候 ， 束 不 会 导 人 致 下 游 项 目 中 的 编译 错误 了 因为 它 已 经 存在 一 
个 默认 分 支 匹配 其 他 情况 。 


7.2.2 下划线 


下 划 线 还 能 用 在 模式 匹配 的 各 种 地 方 ， 用 来 表示 一 个 占 位 符 ， 虽 
然 匹 配 到 了 但 是 忽略 它 的 值 的 情况 : 


Struct P(f32, f32, f32); 


fn calc(arg: P) -> f32 { 
// 匹配 tuple struct, 但 是 忽略 第 二 个 成 员 的 值 

let P(x, _, y) = arg; 

x 过 x 未 y * y 


} 
fn main() { 


let t = P(1.0, 2.0, 3.0); 
println!i("{}", calc(t)); 


对 于 上 例 ， 实 际 上 我 们 还 能 写 得 更 简略 一 点 。 因 为 钞 数 参数 本 喘 
束 具 备 “ 模 式 解 构 ” 功 能 ， 我 们 可 以 直接 在 参数 中 完成 解构 : 


struct P(f32, f32, f32); 
// 参数 类 型 是 P, 参数 本 身 是 一 个 模式 ,解构 之 后 , 变量 x、y 分 别 绑 定 了 第 一 个 和 第 三 个 成 员 
fn calc(P(x, _, y): P) -> f32 { 

x * x 十 y * y 


fn main() { 
let t = P(1.0, 2.0, 3.0); 
println!("{}", calc(t)); 


另外 需要 提醒 的 一 点 是， 下 划 线 更 像 是 一 个 “关键 字 ”， 而 不 是 普 
通 的 “标识 符 ”(identifier) ， 把 它 当成 普通 标识 符 使 用 是 会 有 问题 
的 。 举 例如 下 : 


fn main() { 
let _ = 1 i32; 
let x=_+_; 
println!("{}", x); 
} 


ee 编译 右 并 不 会 把 单独 的 下 划 线 当成 一 个 正常 的 变量 名 
Hh: 


error: expected expression, found ._. 
--> test.rs:4:13 
| 
4 | let x= + 
| 


error[E0425]: cannot find value ‘x in this scope 


如 有 果 把 下 划 线 后 面 跟 上 字母 、 数 字 或 者 下 划 线 ， 那 么 它 束 可 以 成 
为 一 个 正常 的 标识 待 了 。 比 如 ， 连 续 两 个 下 划 线 _， 束 是 一 个 合法 
的 、 正 第 的 “标识 符 ”。 


let_=x; 和 let_y=x; 具有 不 一 样 的 意义 。 这 一 点 在 后 面 的 “ 析 构 函 
数 ” 部 分 还 会 继续 强调 。 如 果 变 量 x 是 非 Copy 类 型 ，]let_=x; 的 意思 
是 “忽略 绑 定 ”>， 此 时 会 直接 调用 x 的 析 构 函数 ， 我 们 不 能 在 后 面 使 用 下 
划 线 _ 读 取 这 个 变量 的 内 容 ， 而 let_y=x; 的 意思 是 “所 有 权 转 移 ”，_y 是 
六 正常 的 变量 名 ，x 的 所 有 权 转 移 到 了 _y 上 ，_y 在 后 面 可 以 继续 使 


下 划 线 在 Rust 里 面 用 处 很 多 ， 比 如 : 在 match 表 达 式 中 表示 “其 他 
分 文 "， 在 模式 中 作为 占 位 符 ， 还 可 以 在 类 型 中 做 占 位 符 ， 在 整数 和 人 小 
数字 面 量 中 做 连接 符 ， 等 等 。 


除了 下 划 线 可 以 在 模式 中 作为 “ 占 位 符 ”， 还 有 两 个 点 .. 也 可 以 在 模 
式 中 作为 " 占 位 符 ” 使 用 。 下划线 表示 省 略 一 个 元 素 ， 两 个 点 可 以 表示 
省 略 多 个 元 素 。 比 如 : 


fn main() { 


2, 3); 
let (a, _)= x; // 模式 解构 
println!("{}", a); 


如 有 条 我 们 希望 只 匹配 tuple 中 的 第 一 个 元 素 ， 其 他 的 省 略 ， 那 么 用 
一 个 下 划 线 是 不 行 的 ， 因 为 这 样 写 ， 左 边 的 tuple 和 右边 的 tuple 不 匹 
配 。 修 改 方案 有 两 种 。 一 种 是 : 


let (a，_，_) = x; // 用 下 划 线 ,那么 个 数 要 匹配 
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男 一 种 是 

let (a，..) = x;  // 用 两 个 点 ,表示 其 他 的 全 部 省 略 

let (a，..，b) = x;// 用 两 个 点 ,表示 只 省 略 所 有 元 素 也 是 可 以 的 


7.2.3 _ match 也 是 表达 式 


跟 Rust 中 其 他 流程 控制 语法 一 样 ，match 语 法 结构 也 同样 可 以 是 表 
达 陈 的 一 部 分 。 示 例如 下 : 


enum Direction { 
East, West, South, North 
} 


fn direction_ to_int(x: Direction) -> i32 


match x { 
Direction::East => 10, 
Direction::West => 20, 
Direction::South => 30, 
Direction: :North => 40, 
} 
} 


fn main() { 
Jet x = Direction::East,; 
let s = direction to_ int(x); 
println!("{}", s); 

} 


match 表 达 式 的 每 个 分 文 可 以 是 表达 式 ， 它 们 要 么 用 大 括号 包 起 
来 ， 要 么 用 去 号 分 开 。 每 个 分 支部 必须 具备 同样 的 类 型 。 在 此 例 中 ， 
这 个 match 表 达 式 的 类 型 为 32， 在 match 后 面 没有 分 号 ， 因 此 这 个 表达 
式 的 值 将 会 作为 整个 函数 的 返回 值 传递 出 去 。 


match 除 了 匹配 “结构 ”， 还 可 以 匹配 “ 值 ”: 


fn category(x: i32) { 
match x { 
-1 => println!("negative"), 
© => println!("zero"), 
1 => println!("positive"), 
=> printilin!("error"), 


fn main() { 
let x = 1; 
category(x); 


我 们 可 以 使 用 或 运算 符 


fn category(x: i32) { 
match x { 
-1 | 1 => println!i("true"), 
© => println!("false"), 
=> println!("error"), 


} 

} 

fn main() { 
let x = 1; 
category(x); 


来 匹配 多 个 条 件 ， 比 如 : 


我 们 还 可 以 使 用 范围 作为 匹配 条 件 ， 使 用 .. 表 示 一 个 前 闭 后 开 区 间 


范围 ， 使 用 .= 表示 一 个 财 区 间 苑 围 : 


let x = 'X'，; 


match x { 
'a' ..= 'Z' => println!("lowercase"), 
'A' ..= 'Z' => println!("uppercase"), 
_ => println!("something else"), 


7.2.4 Guards 


可 以 使 用 if 作 为 “匹配 看 守 ” (match guards) 


条 件 ， 才 执行 后 面 的 语句 。 示 例如 下 : 


。 当 匹配 成 功 且 符 合计 


enum OptionalInt { 
Value(I32)， 
Missing, 


} 
let x = OptionalInt::Value(5); 


match x { 
OptionalInt::Value(i) if i > 5 => println!("Got an int bigger than five!"), 
OptionalInt::Value(..) => println!("Got an int!"), 
OptionalInt::Missing => println!("No Such luck."), 


} 


在 对 变量 的 “ 值 ?进行 匹配 的 时 候 ， 编 译 器 依然 会 保证 “完整 无 租 
泼 ” 检 查 。 但 是 这 个 检查 目前 做 得 并 不 是 很 完美 ， 茶 些 情 况 下 会 发 生 度 
报 的 情况 ， 因 为 毕竟 编译 器 内 部 并 没有 一 个 完整 的 数学 解 算 功 能 : 


fn main() { 
let x = 10; 


match x { 
i if i > 5 => println!("bigger than five"), 
i if i <= 5 => println!("small or equal to five"), 
} 
} 


从 if 条 件 中 可 以 看 到 ， 实 际 上 我 们 已 经 窗 盖 了 所 有 情况 ， 可 惜 还 
古 出 现 了 编译 错误 。 编 译 侨 目前 还 无 法 完美 地 处 理 这 样 的 情况 。 我 们 
只 能 再 加 入 一 条 分 文 ， 单 纯 为 了 避免 编译 错误 : 


=> unreachable!(), 


编译 融会 保证 match 的 所 有 分 文 合 起 来 一 定 窗 盖 了 目标 的 所 有 可 能 
取 值 范围 ， 但 是 并 不 会 保证 各 个 分 文 是 否 会 有 重 琶 的 情况 《毕竟 编译 
器 不 想 做 成 一 个 完整 的 数学 解 算 器 ) 。 如 有 果 不 同 分 文 禾 盖 范 围 出 现 了 
重合 ， 各 个 分 文 之 间 的 允 后 顺序 束 有 影响 了 : 


fn intersect(arg: i32) { 
match arg { 
i if i < 0 => println!("case 1"), 
if i < 10 => println!("case 2"), 
if i * i < 1000 => printin!("case 3"), 
=> printilin!("default case"), 
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} 


fn main() { 
let x = -1; 
intersect(x); 


} 


如 有 条 我 们 进行 匹配 的 值 同 时 符合 好 几 条 分 文 ， 那 么 总 会 执行 第 一 
条 匹配 成 功 的 分 文 ， 忽 略 其 他 分 文 。 


7.2.5 ”变量 绑 定 


我 们 可 以 使 用 @ 符 号 绑 定 变量 。@ 符 号 前 面 是 靳 声明 的 变量 ， 后 
面 是 需要 匹配 的 模式 : 


let x = 1; 


match x { 
eQ@1l1..=5 => println!("got a range element {}", e), 
=> printin!("anything"), 


当 一 个 Pattern 舱 套 层 次 比较 多 的 时 候 ， 如 果 我 们 需要 匹配 更 深层 
次 作为 条 件 ， 项 望 绑 定 上 面 一 层 的 数据 ， 就 需要 像 下 面 这 样 写 : 


#![feature(exclusive_range_pattern)] 


fn deep_match(v: Option<Option<i32>>) -> Option<i32> { 
match v { 
// r 绑 定 到 的 是 第 一 层 0ption 内 部 ,r 的 类 型 是 0ption<i32> 
// 与 这 种 写法 含义 不 一 样 : Some (Some(r)) if (1..10).contains(r) 
Some(r @ Some(1..10)) => r， 
_ => None, 


} 
} 


fn main() { 
let x = Some(Some(5)); 
println!("{:?}", deep_match(x)); 


let y = Some(Some(100)); 
println!("{:?}", deep_match(y)); 


如 采 在 使 用 @ 的 同时 使 用 ， 需 要 保证 在 每 个 条 件 上 都 绑 定 这 个 多 


> 
EE 
let x = 5; 
match x { 
eQ@1i1..5|eQ@8.. 10 => println!("got a range element {}", e), 
_ => println!("anything"), 
} 


7.2.6 ref 和 mnut 


加 如 果 我 们 需要 绑 定 的 是 被 匹配 对 象 的 引用 ， 则 可 以 使 用 ref 关 键 
: 


let x = 5_i32; 


match x { 
ref r => println!("Got a reference to {}"，r)，// 此 时 r 的 类 型 是 `&i32 


} 


之 所 以 在 某 些 时 候 需 要 使 用 ref， 是 因为 模式 匹配 的 时 候 有 可 能 发 
生变 量 的 所 有 权 转 移 ， 使 用 ref 束 是 为 了 避免 出 现 所 有 权 转 移 。 


那么 ref 关 键 子 和 引用 符号 & 有 什么 关系 呢 ? 考虑 以 下 代码 中 变量 
绑 定 x 分 别 是 什么 类 型 ? 


let x = 5_i32; // i32 
let x = &5 1i32,; // &1i32 
let ref x = 5 i32; // ??? 
Jet ref x = &5_ i32; // ??? 


注意 :ref 古 “模式 ”的 一 部 分 ， 它 只 能 出 现在 赋值 号 左边 ， 而 & 符 
号 是 借用 运算 符 ， 是 表达 式 的 一 部 分 ， 它 只 能 出 现在 赋值 号 右边 。 


为 了 搞 清 楚 这 些 变 量 绑 定 的 分 别 是 什么 类 型 ， 我 们 可 以 把 变量 的 
类 型 信息 打印 出 来 看 看 。 有 两 种 方案 : 


利用 编译 右 的 错误 信息 来 帮 我 们 理解 ; 


.利用 标准 库 里 面 的 intrinsic 函 数 打 印 。 
方案 一 ， 示 例如 下 : 


人 一 个 unit 类 型 作为 参数 
fn type_id(_: ()) QQ 


fn main() { 
let ref x = 5_i32; 
// 实际 参数 的 类 型 肯定 不 是 unit, 此 处 必定 有 编译 错误 , 通过 编译 错误 , 我 们 可 以 看 到 实 参 的 具体 类 型 


type_id(x); 


这 里 我 们 写 了 一 个 不 做 任何 事情 的 函数 type_id。 它 接收 一 个 参 
数 ， 类 型 是 () ， 我 们 在 main 函 数 中 调用 这 个 函数 ， 肯 定 会 出 现 类 型 
不 匹配 的 编译 错误 。 错 误 信 息 为 : 


error[E0308]: mismatched types 
--> test.rs:5:13 


type_id(x) 
人 ^ expected (), found &i32 


note: expected type “() 
found type ‘&i32. 


这 个 错误 信息 正 是 我 们 想 要 的 内 容 。 从 中 我 们 可 以 看 到 我 们 感 兴 
趣 的 变量 类 型 。 


量 
方案 二 ， 示 例如 下 ; 


#![feature(core_intrinsics)] 


fn print_type_name<T>(_arg: &T) { 
unsafe 区 
println!("{}", std::intrinsics::type_ name::<T>()); 
} 


} 


fn main() { 
let ref x = 5_i32; 
print_type_name(&x); 


利用 标准 库 里 面 提供 的 type_name 函 数 ， 可 以 打印 出 变量 的 类 型 信 


O 
/UN 


从 以 上 方案 可 以 看 到 ，let ref x=5 i32: 和 ]et x=&5 i32; 这 两 条 语 
句 中 ， 变 量 x 是 同样 的 类 型 &i32 。 


同 理 ， 我 们 可 以 试验 得 出 ，let ref x=&5_i32; 语句 中 ， 变 量 x 绑 定 
的 类 型 是 &&i32。 对 于 更 复杂 的 情况 ， 读 者 可 以 用 类 似 的 办 法 做 试 
验 ， 多 看 看 各 种 情况 下 具体 的 类 型 是 什么 。 


ref 关 键 子 是 “模式 ”的 一 部 分 ， 不 能 修饰 赋值 号 右边 的 值 。let x=ref 
5_i32; 这 样 的 写法 是 错误 的 语法 。 


mut 关 键 字 也 可 以 用 于 模式 绑 定 中 。mnut 关 键 字 和 ref 关 键 字 一 样 ， 
是 “模式 ”的 一 部 分 。Rust 中 ， 所 有 的 变量 绑 定 妹 认 都 是 “不 可 更 
0 使 用 了 mnut 修 饰 的 变量 绑 定 才 有 修改 数据 的 能 力 。 最 简单 
、 儿 日 下: 


fn main() { 
Jet x = 1; 
x = 2; 


} 


编译 错误 ， 错 误 信 息 为 : error: re-assignment of immutable 
variable x。 我 们 必须 使 用 let mut x=1; ， 才 能 在 以 后 的 代码 中 修改 变 
量 绑 定 x。 
量 


使 用 了 mnut 修 饥 的 变量 绑 定 ， 可 以 重新 绑 定 到 其 他 同类 型 的 变 


wl 


fn main() { 
let mut v = vec![1i32, 2, 3]; 
v = vec![4i32, 5, 6]; // 重新 绑 定 到 新 的 Vec 
v = vec![1.0f32, 2, 3]; // 类 型 不 匹配 , 不 能 重新 绑 定 


} 


重新 绑 定 与 前 面 提 到 的 “变量 遮蔽 ”(\shadowing) 是 完全 不 同 的 作 
用 机 制 。“ 重 新 绑 定 ”要 求 变量 本 号 有 mut 修 饥 ， 并 且 不 能 改变 这 个 变量 


的 夫 型 。“ 灾 量 遮蔽 ?要求 必须 重新 声明 一 个 新 的 变量 ， 这 个 新 变量 与 
老 变 量 之 间 的 类 型 可 以 蝇 无 关系 。 


Rust 在 “可 变性 ?方面 ， 默 认为 不 可 修改 。 与 C++ 的 设计 刚好 相反 。 
C++ 默认 为 可 修改 ， 使 用 const 天 键 字 修 饰 的 才 变 成 不 可 修改 。 


mnut 关 键 字 不 仅 可 以 在 模式 用 于 修饰 变量 绑 定 ， 还 能 修饰 指针 
(引用 ) ， 这 里 是 很 多 初学 者 常常 搞 混 的 地 方 。mut 修 饰 变量 绑 定 ， 
与 &mmut 型 引用 ， 是 完全 不 同 的 意义 。 


let mut x: &mut i32; 
// ^1 人 2 


以 上 两 处 的 mut 含 义 古 不 同 的 。 第 1 处 mut， 代 表 这 个 变量 x 本 映 可 
变 ， 因 此 和 它 能 够 重新 绑 定 到 另外 一 个 变量 上 去 ， 具 体 到 这 个 示例 来 
说 ， 就 是 指针 的 指向 可 以 变化 。 第 2 处 mut， 修 饰 的 是 指针 ， 代 表 这 个 
指针 对 于 所 指 加 的 内 存 具 有 修改 能 力 ， 因 此 我 们 可 以 用 *x=1; 这 样 的 
语句 ， 改 变 它 所 指向 的 内 存 的 值 。 


mut 大 键 子 不 像 想 象 中 那么 信 单 ， 我 们 会 经 常 磁 到 与 mut 有 关 的 各 
种 编译 错误 。 在 本 下 中 ， 只 是 简单 介绍 了 它 的 语法 ， 关 于 mut 关 键 字 
人 及 其 正确 使 用 方法 ， 在 本 书 第 二 部 分 还 会 有 详细 摘 
进 二 

至 于 为 什么 有 些 场 景 下 ， 我 们 必须 使 用 ref 来 进行 变量 绑 定 ， 痛 后 


的 原因 跟 *move” 语 义 有 关 。 关 于 变量 的 生命 周期 /所 有 权 / 借 用 /move 等 
概念 ， 请 参考 本 书 第 二 部 分 。 下 面 举 个 例子 : 


fn main() { 
let mut x : Option<String> = Some("hello".into()); 
match x { 
Some(i) => i.push_str("world"), 
None => println!("None"), 


} 


println!("{:?}", x); 


这 上 段 代 码 编 译 硕 会 提示 编译 错误 ， 第 一 个 原因 是 ， 局 部 变量 i 是 不 
可 变 的 ， 所 以 它 无 权 调 用 push_str 方 法 。 我 们 可 以 修改 为 Some (mut 


i) 再 次 编译 。 还 是 会 发 生 编 译 错误 。 这 次 提示 的 是 , “use of partially 
moved value x”。 因为 编译 絮 认 为 这 个 match 语 句 把 内 部 的 String 变 量 
移动 出 来 了 ， 所 以 后 续 的 打印 x 的 值 是 错误 的 行为 。 为 了 保证 这 个 
match 语 句 不 发 生 移动 ， 我 们 需要 把 这 个 模式 继续 修改 为 Some (ref 
mut i) ， 这 一 次 ， 编 译 通 过 了 。 


这 个 问题 还 有 更 简单 的 修复 方式 ， 束 是 把 match x 改 为 match &mut 


fn main() { 
let mut x : Option<String> = Some("hello".into()); 
match &mut x { 
Some(i) => i.push_str("world"), 
None => println!("None"), 


} 


println!("{:?2}", x); 


在 这 种 情况 下 ， 编 译 右 没有 报错 ， 是 因为 我 们 对 指针 做 了 模式 匹 
配 ， 编 译 右 很 聪明 地 推理 出 来 了 了 ， 变 量 i 必须 是 一 个 指针 类 型 ， 所 以 它 
帮 有 我 们 目 动 加 了 ref mut 模 式 ， 它 通过 上 自动 类 型 推导 利己 得 出 了 结论 ， 
认为 的 类 型 是 &mut String。 这 是 编译 器 专门 做 的 一 个 辅助 功能 。 在 很 
多 时 候 ， 特 别 是 类 型 嵌 套 层次 很 多 的 时 候 ， 处 处 都 要 关心 哪个 pattern 
是 不 是 要 加 个 mnut 或 者 ref， 其 实 是 个 很 烦人 的 事情 。 有 了 这 个 功能 ， 
用 户 残 不 用 每 次 都 写 厅 烦 的 mut 或 者 ref， 在 一 些 显而易见 的 情况 下 ， 
编译 絮 目 动 来 帮 我 们 合理 地 使 用 mut 或 者 ref。 读 者 可 以 用 我 们 前 面 实 
现 的 print_type_name 试 试 ， 用 Some (i) 模式 ， 以 及 用 Some (ref mut 
i) 模式 ， 变 量 i 的 类 型 分 别 是 什么 。 结 论 是 类 型 一 样 。 因 为 在 我 们 不 
明确 写 出 来 ref mut 模 式 的 时 候 ， 编 译 妖 帮 我 们 做 了 更 合理 的 目 动 类 型 


性 导 


7.3 计 -let 和 while-let 


Rnust 不 仅 能 在 match 表 达 式 中 执行 “模式 解构 ”， 在 let 语 句 中 ， 也 可 
以 应 用 同样 的 模式 。Rust 还 提供 了 if-let 语 法 糖 。 它 的 语法 为 if let 
PATTERN=EXPRESSION{BODY}。 后 面 可 以 跟 一 个 可 选 的 else 分 支 。 


比如 ， 我 们 有 一 个 类 型 为 Option<T> 的 变量 optVal， 如 果 我 们 需要 
取出 里 面 的 值 ， 可 以 采用 这 种 方式 : 


match optVal { 
Some(x) => { 
doSomethingwith(x); 
} 


— =>" 过 


这 样 做 语法 比较 兄长 ， 从 变量 optVal 到 执行 操作 的 函数 有 两 层 缩 
进 ， 我 们 还 必须 写 一 个 不 做 任何 操作 的 语句 块 才能 满足 语法 要 求 。 换 
一 种 方式 ， 通 过 Option 类 型 的 方法 ， 我 们 可 以 这 么 做 : 


if optVal.is_some() { // 首先 判断 它 一 定 是 Some(_) 
let x = optval,unwrap(); // 然后 取出 内 部 的 数据 
doSomethingwith(x); 


} 


从 视觉 上 来 看 ， 代 码 缩 进 层 次 减少 到 了 一 层 。 但 是 它 在 运行 期 实 
际 上 判断 了 两 次 optVal 里 面 是 否 有 值 : 第 一 次 是 is_some () 函数 ， 第 
二 次 是 unwrap () 画 数 。 从 执行 效率 上 来 说 是 降低 了 的 。 而 使 用 让 let 
语法 ， 则 可 以 这 人 么 做 : 


if let Some(x) = optVal { 
doSomethingwith(x); 


这 其 实 是 一 个 人 简单 的 语法 糖 ， 其 痛 后 执行 的 代码 与 match 表 达 式 相 
比 ， 并 无 效率 上 的 差别 。 它 跟 match 的 区 别 是 : match 一 定 要 完整 匹 
配 ， 计 let 只 匹配 感 兴趣 的 某 个 特定 的 分 文 ， 这 种 情况 下 的 写法 比 match 


人 简单 点 。 同 理 ，while-let 与 if-let 一 样 ， 提 供 了 在 while 语 句 中 使 用 “模式 
解构 ”的 能 力 ， 此 处 就 不 再 举例 。 


if-let 和 while-let 还 支持 模式 的 “或 ”操作 (此 功能 目前 尚未 在 编译 器 
中 实现 ) 。 比 如 ， 我 们 有 如 下 enum 定 义 : 


enum E<T> { 
A(T), B(T), C, D, E, F 


如 果 我 们 需要 匹配 “<C 或 者 D”"， 那 么 可 以 这 样 写 : 
let r = if let C | D=x{1} else {2 }; 
这 上 段 代码 等 同 于 : 


let r = match x { 
C6. | D: => 1; 
— => 2, 


} 
在 这 个 匹配 过 程 中 还 可 以 有 变量 绑 定 ， 比 如 : 


while let A(x) | B(x) = expr { 
do_something(x); 


} 
这 上段 代码 等 同 于 : 


match expr { 
A(x) | B(x) => do_something(x), 
— => {}, 


7.4 ”了 汞 数 和 财 包 参数 做 模式 解构 


示例 如 下 。 一 个 画 数 接受 一 个 结构 体 参数 ， 可 以 直接 在 参数 这 里 
做 模式 解构 


Struct T { 
Item1: char, 
item2: bool, 


fn test( T{item1: argi, item2: arg2} : T) { 
println!("{} {€}", arg1i, arg2); 


fn main() 
let x=TH{ 
Item1: 'A', 
item2: false, 
}; 
test(x); 


oC 


7.5 总结 


“模式 解构 ?是 Rust 中 较为 复杂 的 一 个 功能 ， 但 是 非常 实用 。 
-Rust 的 “模式 解构 ?功能 在 语法 上 具有 民 好 的 一 致 性 和 扩展 性 ; 


.Rust 的 “模式 解构 ?功能 不 仅 出 现在 match 语 名 中， 还 可 以 出 现在 
let、if-let、while-let、 函 数 调用 、 闭 包 调 用 等 情景 中 ; 


:Rust 的 “模式 解构 ”功能 可 以 应 用 于 各 种 数据 类 型 ， 包 括 但 不 限于 
tuple、struct、enum 等 ， 和 暂时 在 稳定 版 中 不 文 持 slice 的 模式 匹配 ; 


:Rust 的 “模式 解构 ”功能 要 求 “ 无 遗漏 * 的 分 析 (exhaustive case 
analysis) ， 确 保 不 会 因为 不 小 心 而 漏 掉 某 些 情况 ; 


-Rust 的 “模式 解构 ?与 Rust 的 核心 所 有 权 管 理 功能 完全 相 容 。 


第 8 昔 ” 深 入 类 型 系统 


Rust 的 类 型 系统 实际 上 是 一 种 代数 类 型 系统 (Algebraic data 
type) 。 它 在 数学 上 是 有 严格 定义 的 ， 非 常 严 齐 的 一 套 理论 。 本 章 试 
图 用 一 种 比较 通俗 的 语言 ， 人 简单 地 解释 一 下 什么 是 代数 类 型 系统 ， 我 
们 应 该 如 何 理解 它 ， 以 及 它 给 Rust 带 来 了 哪些 优势 。 


8.1 代数 类 型 系统 


代数 ， 我 们 以 前 都 学 过 。 比 如 ， 给 定 一 个 整数 x， 我 们 可 以 对 它 执 
行 一 些 数学 运算 ， 像 加 法 、 乘 法 之 类 的 : 


X + 工 
2 区 


我 们 还 可 以 从 中 总 结 出 一 些 规律 ， 比 如 ， 任 何 一 个 整数 与 0 之 和 等 
于 它 本 喘 ， 任 何 数 与 0 之 积 等 于 0， 任 何 一 个 整数 与 1 之 积 等 于 它 本 吴 。 
用 数学 语言 描述 ， 可 以 这 样 写 : 


在 代数 里 面 ， 我 们 的 变量 x 代表 的 十 某 个 集合 内 的 数字 ， 执 行 的 操 
作 一 般 是 加 减 乘 除 一 类 的 数学 运算 。 而 对 应 到 代数 类 型 系统 上 ， 我 们 
可 以 把 类 型 类 比 为 代数 中 的 变量 ， 把 类 型 之 间 的 组 合 关系 类 比 为 代数 
中 的 数学 运算 。 


我 们 可 以 做 这 样 一 个 假定 ， 一 个 类 型 所 有 取 值 的 可 能 性 叫 作 这 个 
类 型 的 “基数 ”(cardinality) 。 那 么 在 此 基础 上 ， 我 们 可 以 得 出 结论 : 
最 简单 的 类 型 unit () 的 基数 就 是 1， 它 可 能 的 取 值 范围 只 能 是 () 。 
再 比如 说 ，bool 类 型 的 基数 瓯 是 2， 可 能 的 取 值 范围 有 两 个 ， 分 别 是 
true 和 false。 对 于 i32 类 型 ， 它 的 取 值 范围 是 232， 我 们 用 Cardinality 
(i32) 来 代表 i32 的 基数 。 


我 们 把 多 个 类 型 组 合 到 一 起 形成 新 的 复合 类 型 ， 这 个 新 的 类 型 吏 
会 有 痢 的 基数 。 如 条 两 个 类 型 的 基数 是 一 样 的 ， 那 么 我 们 可 以 说 它们 
携 市 的 信息 量 其 实 是 一 样 的 ， 我 们 也 可 以 说 它们 是 “ 同 构 ” 的 。 下 面 是 
一 个 典型 的 例子 : 


type T1 = [i32; 2]; 
type T2 = (i32, i32),; 
struct T3(i32, i32); 


Struct T4 { 
fie1ld1: i32, 
field2: i32, 

} 


上 面 出 现 了 四 个 类 型 ， 在 实践 中 ， 它 们 不 是 同一 个 类 型 ， 是 无 法 
通用 的 。 但 是 从 数学 上 讲 ， 这 四 个 类 型 表达 出 来 的 信息 量 是 完全 一 样 
的 ， 它 们 都 只 能 效 下 两 个 132 类 型 的 成 员 。 它 们 的 基数 都 是 Cardinality 

(i32) *Cardinality (i32) 。 


tuple、struct、tuple struct 这 几 种 类 型 ， 实 质 上 是 同样 的 内 存 布 
局 ， 区 别 仅 仅 在 于 是 否 给 类 型 及 成 员 起 了 名 字 。 这 几 个 类 型 都 可 以 类 
比 为 代数 中 的 “ 求 积 ”运算 。 没 有 成 员 的 tuple 类 型 ， 它 的 基数 就 是 1。 同 
0 基数 也 是 1， 它 们 都 可 以 类 比 为 代数 运算 
J 数字 1 。 


那么 ， 如 有 果 struct 里 面 有 多 个 成 员 ， 比 如 : 


struct Rf{ 
Var1 : bool, 
Var2 : bool, 


} 


R 类 型 包括 了 两 个 成 员 。 分 别 是 var1 和 var2。 它 的 基数 是 : 


Cardinality(R) = Cardinality(var1) * Cardinality(var2) =2*2=4 


如 果 我 们 在 结构 体 里 面 加 入 一 个 unit 类 型 的 成 员 : 


struct Prod { 
fieldi: i32, 
field2: (), 
} 


这 个 field2 成 员 实 际 上 对 这 个 结构 体 没 有 市 来 什么 页 献 ， 它 并 没有 
市 来 额外 的 信息 量 : 


Cardinality(Prod) = Cardinality(field1) * 1 = Cardinality(i32) 


对 于 数组 类 型 ， 可 以 对 应 为 每 个 成 员 类 型 都 相同 的 tuple 类 型 (或 
者 struct 是 一 样 的 ) 。 用 数学 公式 类 比 ， 则 比较 像 乘 方 运算 。 


Rust 中 的 enum 类 型 就 相当 于 代数 中 的 “ 求 和 ”运算 。 比 如 ， 某 个 类 
型 可 以 代表 “东南 西北 ”四 个 方向 ， 我们 可 以 如 下 设计 : 


enum Direction { 
North, East, South, West 
} 


它 可 能 的 取 值 范围 是 四 种 可 能 性 ， 它 的 基数 就 是 4°。 我 们 可 以 把 它 
看 作 是 四 个 无 成 员 的 struct 的 “或 ?关系 。 


Cardinality(Direction) = Cardinality(North) + Cardinality(East) 
+ Cardinality(South) + Cardinality(West) 
总 " 泣 


实际 上 ， 我 们 甚至 可 以 将 内 置 的 bool 类 型 定义 为 一 个 标准 库 中 的 


enum: 


enum Bool { True, False } 


这 样 定义 的 Bool 类 型 和 目前 的 内 置 bool 类 型 表达 能 力 上 是 没有 什 
么 差别 的 。 


标准 库 中 有 一 个 极其 常见 的 类 型 叫 作 Option<T>， 它 是 这 么 定义 
的 : 
enum Option<T> { 


None, 
Some(T), 


由 于 它 实在 是 太 常用 ， 标 准 库 将 Option 以 及 它 的 成 员 Some、None 
都 加 入 到 了 Prelude 中 ， 用 户 甚 至 不 需要 use 语 句 声明 束 可 以 直接 使 用 。 
其 中 T 是 一 个 泛 型 参数 ， 在 使 用 的 时 候 可 以 被 蔡 换 为 实际 类 型 。 例 
如 ，Option<i32> 类 型 实际 上 等 同 于 : 


enum Option<i32> { 


Some(i32), 
None 
} 
因此 它 的 基数 是 : 


Cardinality(Option<i32>) = Cardinality(i32) + 1 


同 理 ， 我 们 可 以 得 出 一 个 空 的 enum， 基 数 是 0。 


通过 上 文中 的 示例 ， 我 们 可 以 为 “代数 类 型 系统 ?和 “代数 ”建立 一 
个 直观 的 类 比 关 系 。 空 的 enum 可 以 类 比 为 数字 0;，unit 类 型 或 者 空 结构 
体 可 以 类 比 为 数字 1; enum 类 型 可 以 类 比 为 代数 运算 中 的 求 和 ; 
tuple、struct 可 以 类 比 为 代数 运算 中 的 求 积 ， 数 组 可 以 类 比 为 代数 运算 
中 的 乘 方 。 同 理 ， 我 们 还 能 继续 做 更 多 的 类 比 。 


enum 类 型 的 每 个 成 员 还 允许 包含 更 多 关联 数据 : 


enum Message { 
uit 
ChangeColor (i32, i32, i32), 
Move { x: i32, y: i32 } 
} 


这 了 束 好 比 enum 的 每 个 成 员 还 可 以 是 tuple 或 者 struct。 类 比 到 代数 ， 
相当 于 加 法 乘法 混合 运算 : 


Cardinality(Message) = Cardinality(Quit) + Cardinality(ChangeColor) + 
Cardinality(Move) 

= 1 + Cardinality(i32)^3 + Cardinality(i32)^2 
// 此 处 用 ^ 代表 乘 方 , 不 是 异 或 


加 法 具有 交换 率 ， 同 理 ，enum 中 的 成 员 交 换 位 置 ， 也 不 会 影响 它 
的 表达 能 力 ; 乘法 具有 交换 率 ， 同 理 ，struct 中 的 成 员 交 换 位 置 ， 也 不 
影响 它 的 表达 能 力 。 


乘法 具有 结合 律 : x* (y*z) = (x*y) *z， 同 理 ， 对 于 tuple 类 型 
(A，(B, C) ) 和 ( (A，B) ，C) 的 表达 能 力 是 一 样 的 。 


继续 列 下 去 ， 我 们 还 能 做 出 更 多 的 类 比 ， 这 是 一 个 非常 庞大 的 话 
题 。 读 者 可 以 到 网 上 搜索 更 多 、 更 详尽 的 天 于 ADT 的 讲解 文章 。 下 面 
我 们 讲 一 下 Never type 这 个 类 型 。 


8.2 Never LIype 


如 有 我 们 考虑 一 个 类 型 在 机 器 层面 的 表示 方式 ， 一 个 类 型 占用 的 
bit 位 数 可 以 决定 它 能 携带 多 少 信 息 。 假 设 我 们 用 bits_of (T) 代表 类 型 
T 占 用 的 bit 位 数 ， 那 么 2Abits_ of (T) =Cardinality (T) 。 反 过 来 ,我 
们 可 以 得 出 结论 ， 存 储 一 个 类 型 需要 的 bit 位 数 等 于 bits_of \T) =log2 
(Cardinality (T) ) 。 比 如 说 ，bool 类 型 的 基数 为 2， 那 么 在 内 存 中 表 
示 这 个 类 型 需要 的 bit 位 应 该 为 bits_of (bool) =log2 (2) =1， 也 就 是 1 
个 bit 束 足够 表达 。 


我 们 前 面 已 经 看 到 了 ， 在 代数 类 型 系统 中 有 一 些 比 较 特 殊 的 类 
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型 
像 anit 类 型 和 没有 成 员 的 空 struct 类 型 ， 都 可 以 类 比 为 代数 中 的 数 

字 1。 这 样 的 类 型 在 内 存 中 实际 需要 占用 的 空间 为 bits of ( () ) 

=log2 (1) =0。 也 就 是 说 ， 这 样 的 类 型 实际 上 是 0 大 小 的 类 型 。 这 样 的 

性 质 有 很 多 好 处 ， 比 如 ，Rust 里 面 HashSet 的 定义 方式 为 : 


pub struct HashSet<T，S = RandomState> { 
map: HashMap<T, (), S>, 
} 


也 就 是 说 ， 只 要 把 HashMap 中 存 的 键 值 对 中 的 “ 值 ”指定 为 unit 类 型 
束 可 以 了 。 这 个 设计 和 我 们 的 思维 模型 是 一 至 的。 所 谓 的 HashSet， 束 
征 只 有 key 没 有 value 的 HashMap“。 如 采 我 们 没有 真正 意义 上 的 0 大 小 类 
型 ， 这 个 设计 是 无 法 做 到 如 此 简洁 的 。 


没有 任何 成 员 的 空 enum 类 型 ， 都 可 以 类 比 为 代数 中 的 数字 0， 例 
中 : 


enum Never 人 


这 个 Never 没 有 任何 成 员 。 如 采 声 明 一 个 这 种 类 型 的 变量 ,let 
e=Never: : ? ? ? ; ， 我 们 都 不 知道 该 怎么 初始 化 ， 因 为 Rust 根 本 束 


没有 提供 任何 语法 为 这 样 的 类 型 构造 出 变量 。 这 样 的 类 型 在 Rust 类 型 
系统 中 的 名 字 叫 作 never typpe， 它 们 有 一 些 属性 是 其 他 类 型 不 具备 的 : 


它们 在 运行 时 根本 不 可 能 存在 ， 因 为 根本 没有 什么 语法 可 以 构造 
出 这 样 的 变量 ; 


‘Cardinality (Never) =0; 


.考虑 它 需 要 占用 的 内 存 空间 bits_of (Never) =log2 (0) =-%， 也 
忠 古 说 逻辑 上 是 不 可 能 存在 的 东西 ; 


处 理 这 种 类 型 的 代码 ， 根 本 不 可 能 执行 ; 
返回 这 种 类 型 的 代码 ， 根 本 不 可 能 返回 ; 
它们 可 以 被 转换 为 任意 类 型 。 

这 些 有 什么 意义 呢 ， 我 们 来 看 以 下 代码 : 


loop { 
let x : i32 = if cond { 1 } else { continue; }; 


} 


我 们 知道 ， 在 Rust 中 ，if-else 也 是 表达 式 ， 而 且 每 个 分 支 表 达 式 类 
型 必须 一 致 。 这 种 有 continue 的 情况 ， 类 型 检查 是 怎样 通过 的 呢 ? 如果 
我 们 把 continue 语 句 的 类 型 指定 为 never 类 型 ， 那 么 一 切 就 都 顺理成章 
了 。 因 为 never 类 型 可 以 转换 为 任意 类 型 ， 所 以 ， 它 可 以 符合 与 让 分 文 
的 类 型 相 一 致 的 规定 。 它 根本 不 可 能 返回 ， 所 以 执行 到 else 分 支 的 时 
候 ， 接 下 来 根本 不 会 执行 对 变量 x 的 赋值 操作 ， 会 进入 下 一 次 的 循环 。 
如 果 这 个 分 支 大 括号 内 部 continue 后 面 还 有 其 他 代码 ， 编 译 絮 可 以 很 容 
易 判 断 出 来 ， 它 后 面 的 代码 是 永远 不 可 能 执行 的 死 代 码 。 一 切 都 在 类 
型 系统 层面 得 到 了 统一 。 


所 以 说 ，never 类 型 是 Rust 类 型 系统 中 不 可 缺少 的 一 部 分 。 与 unit 
类 型 类 似 ， 一 般 我 们 用 空 tuple () 代表 unit 类 型 ，Rust 里 面 其 实 也 有 一 
个 专门 的 类 型 来 表示 never， 也 了 束 是 我 们 前 面 提 到 过 的 感叹 号 ! 。 所 请 
的 “diverging function” 就 是 一 个 返回 never type 的 函数 。 在 早期 版 本 中 ， 


Rust 的 做 法 是 把 diverging function 做 特殊 处 理 ， 使 得 它 在 分 文 结 构 表 达 
式 的 类 型 检查 能 够 通过 ， 而 没有 把 它 当 成 真正 浊 义 上 的 类 型 。 后 来 ， 
有 一 个 RFC 1216 对 这 个 never type 做 了 完整 的 设计 ， 才 真正 将 它 提升 为 
一 个 类 型 。 而 且 ， 直 到 编写 本 书 时 候 的 1.19 版 本 ， 这 个 功能 的 完整 实 
现 也 还 没有 完全 做 完 。 


除了 在 数学 形式 上 的 统一 ， 以 及 显而易见 的 对 分 文 结构 表达 式 的 
类 型 检查 有 好 处 之 外 ， 一 个 完整 的 never type 对 于 Rusti 不 些 其 他 的 
现实 意义 。 下 面 举 几 个 例子 来 说 明 。 

场景 一 : 可 以 使 得 泛 型 代码 兼容 diverging function 


比如 ， 一 个 这 样 的 泛 型 方法 接受 一 个 泛 型 画 数 类 型 作为 参数 ， 可 


反 


fn main() { 

fn call_fn<T, i 和 ->T> (f: F, arg: 132) ->T {f(arg) } 

// 如 果 不 把 ! 当成 一 那么 下 面 这 人 句 话 会 出 现 编译 错误 ， 因为 只 有 类 型 才能 替换 类 型 参数 
call fn(std: i :exit, 0); 


} 


be 


场景 二 : 更 好 的 死 代码 检查 


let t = std::thread::spawn(|| panic!("nope")); 
t.join().unwrap(); 
println!("hello"); 


如 果 我 们 有 完整 的 never 类 型 支持 ， 那 么 编译 器 应 该 可 以 推理 出 闭 
包 的 返回 类 型 是 ! ， 而 不 是 () ， 因 此 tjoin () .unwrap () 会 产生 一 
个 ! 类 型 ， 编译 器 因此 可 以 检查 出 printIn 永 远 不 可 能 执行 。 

场景 三 : 可 以 用 更 好 的 方式 表达 “不 可 能 出 现 的 情况 ” 


标准 库 中 有 一 个 trait 叫 FromStr， 它 有 一 个 关联 类 型 代表 错误 : 


pub trait FromStr { 

type Err， 

fn from_str(S: &str) -> Result<Self, Self::Err>,; 
} 


如 果 某 些 类 型 调用 from_str 方 法 永远 不 会 出 错 ， 那 么 这 


可 以 指定 为 ! 。 


struct T(String); 


impl FromStr for T { 
type Err = !;， 


fn from_str(s: &str) -> Result<T, !> { 
Ok(T(String::from(s))) 
} 


对 于 错误 处 理 ， 我 们 可 以 让 Resulb 民 化 成 没有 错误 的 情 


use std::str::Fromstr; 
Use std::mem::{size of, size of_val}; 


struct T(String); 


impl] FromStr for T { 
type Err = !， 


fn from_str(s: &str) -> Result<T, !> { 
Ok(T(String::from(s))) 
} 


fn main() { 
let r: Result<T, !> = T::from_str("hello"); 
println!("Size of T: {}", size_of::<T>()); 
println!("Size of Result: {}", size_of_val(&r)); 
// 将 其 至 应 该 可 以 接 用 let 语句 进行 模式 匹配 而 不 发 生 编译 错误 
// 因为 编译 器 有 能 力 推 理 出 Err 分 支 没 必要 存在 
// let Ok(T(ref S)) = r; 
// printin!("{}", Ss); 


tI 


这 里 其 实 根 本 不 需要 考虑 Er 的 情况 ， 因 为 Er 的 类 型 是 
哪怕 match 语 句 中 只 有 Ok 分 支 ， 


文 个 Err 类 型 


部 : 


所 以 


编译 器 也 可 以 判定 其 为“ 完整 匹配 ”。 


8.3 ”上 再 谈 Option 关 型 


Rust 中 的 Option 类 型 解决 了 许多 编程 语言 中 的 “ 空 指针 ”问题 。 


在 目前 的 许多 编程 语言 中 ， 都 存在 一 个 很 有 意思 的 特殊 指针 (或 
者 引用 ) ， 它 代表 指 同 的 对 象 为 “ 空 >， 名 字 一 般 叫 作 null 、nil、 
None、Nothing、nullptr 等 。 这 个 空 指针 看 似 简单 ， 但 它 引发 的 问题 却 
一 点 也 不 少 。 空 指针 错误 对 许多 朋友 来 说 都 不 陌生 ， 它 在 许多 编程 语 
言 中 都 是 极为 常见 的 。 以 Java 为 例 。 我 们 有 一 个 String 类 型 的 引用 ， 
String str=null; 。 如 果 它 的 值 为 null， 那 么 接 下 来 用 它 调 用 成 员 函 数 的 
时 候 ， 程 序 吏 会 抛 出 一 个 NulPointerException。 如 果 不 catch 住 这 个 异 
常 ， 整 个 程序 就 会 crash 掉 。 据 说 ， 这 一 类 问题 已 经 造成 了 业界 无 法 估 
量 的 巨大 损失 。 


在 2009 年 的 某 次 会 议 中 ， 著 名 的 “快速 排序 ”算法 的 发 明 者 Tony 
WLHY: 


I call it my billion-dollar mistake.It was the invention of the null 
reference in 1965.At that time, I was designing the first comprehensive 
type system for references in an object oriented language (ALGOL 
W) .My goal was to ensure that all use of references should be absolutely 
safe, with checking performed automatically by the compiler.But I 
couldn’t resist the temptation to put in a null reference, simply because it 
was so easy to implement.This has led to innumerable errors, 
vulnerabilities, and system crashes, which have probably caused a billion 
dollars of pain and damage in the last forty years. 


原来 ， 在 程序 语言 中 加 入 空 指针 设计 ， 其 实 并 非 是 经 过 深思 熟 虑 
的 结 采 ， 而 仅仅 是 因为 它 很 容易 实现 而 已 。 这 个 设计 的 影响 是 如 此 深 
远 ， 以 至 于 后 来 许多 编程 语言 都 不 假 思 索 地 继承 了 这 一 设计 ， 苑 围 几 
乎 包括 了 目前 业界 所 有 流行 的 编程 语言 。 


空 指针 最 大 的 问题 在 于 ， 它 违 痛 了 类 型 系统 的 初 囊 。 我 们 再 来 回 
忆 一 下 什么 是 “类 型 ”。 按 维基 百科 的 定义 ， 类 型 是 : 


Type is a classification identifying one of various types of data, that 
determines the possible values for that type，the operations that can be 
done on values of that type，the meaning of the data，and the way values 
of that type can be stored. 


“类 型 "规定 了 数据 可 能 的 取 值 范围 ， 规 定 了 在 这 些 值 上 可 能 的 操 
作 ， 也 规定 了 这 些 数据 代表 的 侣 义 ， 还 规定 了 这 些 数据 的 存储 方式 。 


我 们 如 果 有 一 个 类 型 Thing， 它 有 一 个 成 员 函 数 doSomeThing 
JW ， 那 么 只 要 是 这 个 类 型 的 变量 ， 就 一 定 应 该 可 以 调用 
doSomeThing () 函数 ， 完 成 同样 的 操作 ， 返 回 同样 类 型 的 返回 值 。 


但 是，null 违 背 了 这 样 的 约定 。 一 个 正常 的 指针 和 一 个 null 指 针 ， 
哪怕 它们 是 同样 的 类 型 ， 做 同样 的 操作 ， 所 得 到 的 结 末 也 是 不 一 样 
的 。 那 么 ， 完 什么 说 null 指 针 和 普通 指针 是 一 个 类 型 呢 ? null 实 际 上 有 是 
在 类 型 系统 上 打开 了 一 个 缺口 ， 引 入 一 个 必须 在 运行 期 特殊 处 理 的 特 
殊 “ 值 ”。 它 束 像 一 个 全 局 的 、 无 类 型 的 singleton 变 量 一 样 ， 可 以 无 处 
不 在 ， 可 以 随意 与 任意 指针 实现 目 动 类 型 转换 。 它 让 编译 事 的 类 型 检 
查 在 此 处 失去 了 意义 。 


那么 ，Rust 里 面 的 解决 方案 是 什么 呢 ? 那 就 是 ， 利 用 类 型 系统 

(ADT) 将 空 指针 和 非 空 指针 区 别 开 来 ， 分 别 赋予 它们 不 同 的 操作 权 
限 ， 禁 止 针 对 空 指针 执行 解 引 用 操作 。 编 译 帮 和 静态 检查 工具 不 可 能 
知道 一 个 变量 在 运行 期 的 * 值 >”， 但 是 可 以 检查 所 有 变量 所 属 的 “类 
型 ”>， 来 判断 它 是 否 符合 了 类 型 系统 的 各 种 约定 。 如 果 我 们 把 null 从 一 
个 “ 值 ”* 上 升 为 一 个 “类 型 *， 那 么 静态 检查 就 可 以 发 挥 其 功能 了 了 人。 实际 
上 早 束 已 经 有 了 这 样 的 设计 ， 叫 作 Option Type， 并 在 scala、haskell、 
Ocaml、F# 等 许多 程序 设计 语言 中 存在 了 许多 年 。 


下 面 我 们 以 Rust 为 例 ， 介 绍 一 下 Option 是 如 何 解决 空 指针 问题 
的 。 在 Rust 中 ，Option 实 际 上 只 是 一 个 标准 库 中 普通 的 enum: 


pub enum Option<T> { 
/// No value 
None, 
/// Some value ‘TT. 
Some(T) 

} 


Rust 中 的 enum 要 求 ， 在 使 用 的 时 候 必 须 “ 完 整 匹 配 ”。 意 思 是 说 ， 
enum 中 的 每 一 种 可 能 性 都 必须 处 理 ， 不 能 遗漏 。 对 于 一 个 可 空 的 
Option<T> 类 型 ， 我 们 没有 办 法 直接 调用 T 类 型 的 成 员 函 数 ， 要 么 用 模 
人 要 么 调用 Option 类 型 的 成 
册 方 法 。 


而 对 于 普通 非 空 类 型 ，Rust 不 允许 赋值 为 None， 也 不 允许 不 初始 
化 束 使 用 。 在 Rust 中 ， 也 没有 null 这 样 的 天 键 字 。 为 外 ，Option 类 型 参 
数 可 以 是 常见 的 指针 类 型 ， 如 Box 和 & 等 ， 也 可 以 是 非 指 针 类 型 ， 它 的 
表达 能 力 其 实 已 经 超过 了 “可 空 的 指针 ”这 一 种 类 型 。 


实际 上 ，C++/C# 等 语言 也 发 现 了 初始 设计 中 的 缺点 ， 并 开发 了 一 
些 补救 措施 。C++ 标 准 库 中 加 入 了 std: : optional<T> 类 型 ，C# 中 加 入 
了 System.Nullable<T> 类 型 。 可 惜 的 是 ， 受 限于 早期 版 本 的 兼容 性 ， 这 
些 设计 已 经 不 能 作为 强制 要 求 使 用 ， 因 此 其 作用 也 就 弱化 了 许多 。 


Option 类 型 有 许多 非常 方便 的 成 员 函 数 可 供 使 用 ， 男 外 我 们 还 可 
以 利用 if-let、while-let 等 语法 糖 。 许 多 情况 下 ， 没 必要 每 次 都 动用 
match 语 句 。 


比如 ，map 方 法 可 以 把 一 个 Option<U> 类 型 转 为 另外 一 个 
Option<V> 类 型 . 


let maybe_some_string = Some(String::from("Hello, World!")); 
let maybe_some_len = maybe_some_string.map(|s| s.1len()); 
assert_eq!(maybe_some_len, Some(13)); 


再 比如 ，and_then 方 法 可 以 把 一 系列 操作 串联 起 来 : 


fn sq(x: U32) -> Option<u32> { Some(x * x) } 
fn nope(_: U32) -> Option<u32> { None } 


assert_eq!(Some(2).and_then(sq).and_ then(sq), Some(16)); 


而 unwrap 方 法 则 是 从 Option<T> 中 提取 出 T。 如 果 当 前 状态 是 
None， 那 么 这 个 函数 会 执行 失败 导致 panic。 正 因为 如 此 ， 除 非 是 写 不 
重要 的 小 工具 之 类 的 ， 否 则 这 个 方法 是 不 推荐 使 用 的 。 哪 人 你 很 确定 


此 时 Option 的 状态 一 定 是 Some， 最 好 也 用 expect 方 法 代替 ， 至 少 它 在 
发 生 panic 的 时 候 还 会 打印 出 一 个 字符 串 ， 方 便 我 们 查找 原因 。 


这 个 类 型 还 有 许多 有 用 的 方法 ， 各 位 读者 应 该 去 查阅 一 下 标准 库 
的 文档 ， 对 它 的 成 员 方 法 烂熟 于 心 。 

Option 类 型 不 仅 在 表达 能 力 上 非常 优秀 ， 而 且 运 行 开销 也 非常 
。 在 这 里 我 们 还 可 以 再 次 看 到 “ 零 性 能 损失 的 抽象 ”能力 。 示 例如 


use std::mem::size_of; 


fn main() { 


printlin!("size of isize : {}", 
size_of::<isize>() ); 
println!("size of Option<isize> 4 


size_of::<0Option<isize>>() ); 


println!("Size of &isize : {}", 
size_of::<&isize>() ); 
println!("size of Box<isize> : {}", 


size_of::<Box<isize>>() ); 


println!("size of Option<&isize> pe 从 
size_of::<0Option<&isize>>() ); 

println!("size of Option<Box<isize>> : {}", 
size_of::<0Option<Box<isize>>>() ); 


println!("size of *const isize 3 
size_of::<* const isize>() ); 

println!("size of Option<*const isize> : {}", 
size_of::<0Option<*const isize>>() ); 


ee 分 析 了 Option 类 型 在 执行 阶段 所 占用 的 内 存 空间 大 小 ， 


size of isize 

size of Option<isize> 

size of &isize 

size of Box<isize> 

size of Option<&isize> 

size of Option<Box<isize>> 
size of *const isize 

size of Option<*const isize> 


O) 


上 Oo co co oo oo 上 情 oo 


[ey] 


其 中 ， 不 带 Option 的 类 型 大 小 完全 在 意料 之 中 。 
isize&isizeBox<isize> 这 几 个 类 型 占用 空间 的 大 小 都 等 于 该 系统 平台 上 
一 个 指针 占用 的 空间 大 小 ， 不 足 为 奇 。 Option<isize> 类 型 实际 表示 的 
含义 是 “可 能 为 空 的 整数 "， 因 此 它 除 了 需要 存储 一 个 isize 空 间 的 大 小 
之 外 ， 还 需要 一 个 标记 位 (至少 1bit) 来 表示 该 值 存在 还 是 不 存在 的 
状态 。 这 里 的 结果 是 16， 猜 测 可 能 是 因为 内 存 对 齐 的 原因 。 


最 让 人 惊奇 的 是 ， 那 两 个 “可 空 的 指针 ”类 型 占用 的 空间 竟然 和 一 
个 指针 占用 的 空间 相同 ， 并 未 多 少 改 一 点 点 的 空间 来 表示 “指针 是 否 为 
空 ”* 的 状态 。 这 是 因为 Rust 在 这 里 做 了 一 个 小 优化 ， 根据 Rust 的 设计 ， 
童 用 指针 & 和 所 有 权 指 针 Box 从 语义 上 来 说 ， 都 是 不 可 能 为 “0” 的 状 
态 。 有 些 数值 是 不 可 能 成 为 这 几 个 指针 指 回 的 地 址 的 ， 它 们 的 取 值 范 
围 实 际 上 小 于 isize 类 型 的 取 值 范围 。 因 此 Option<&isize> 和 
Option<Box<isize>> 类 型 可 以 利用 这 个 特点 ， 使 用 “0” 值 代表 当前 状态 
为 “ 空 ”。 这 意味 厦 ， 在 编译 后 的 机 器 码 层面 ， 使 用 Option 类 型 对 指针 
的 包 疾 ， 与 C/C++ 的 指针 完全 没有 区 别 。 


Rust 是 如 何 做 到 这 一 点 的 呢 ? 在 目前 的 版 本 中 ，Rust 设 计 了 
NonZero 这 样 一 个 struct。 (这 个 设计 目前 还 处 于 不 稳定 状态 ， 将 来 很 
可 能 会 有 变化 ， 但 是 基本 思路 应 该 是 不 变 的 。) 


/// A wrapper type for raw pointers and integers that will never be 
/// NULL or 0 that might allow certain optimizations. 

#[lang = "non_zero"] 

#[derive(Copy, Clone, Eq, PartialEq, Ord, PartialOrd, Debug, Hash)] 
pub struct NonZero<T: Zeroable>(T); 


它 有 一 个 attribute#[lang="..."] 表 明 这 个 结构 体 是 Rust 语 言 的 一 部 
分 。 它 是 被 编译 器 特殊 处 理 的， 凡是 被 这 个 结构 体 包 起 来 的 尖 型 ， 编 
译 器 都 将 其 视 为 “不 可 能 为 0” 的 。 


我 们 再 看 一 下 Box<T> 的 定义 : 


#[lang = "owned_box"] 
#[fundamental] 
pub struct Box<T: ?Sized>(Unique<T>); 


其 中 ，Unique<T> 的 定义 是 : 


pub struct Unique<T: ?Sized> { 
pointer: NonZero<*const T>, 
_marker: PhantomData<T>, 


} 


其 中 PhantomData<T> 是 一 个 零 大 小 的 类 型 pub struct Phantom- 
Data<T: ? Sized>; ， 它 的 作用 是 在 unsafe 编 程 的 时 候 辅 助 编译 韭 静态 
检查 ， 在 运行 阶段 无 性 能 开销 ， 此 处 暂时 略 过 。 


把 以 上 代码 综合 起 来 可 以 发 现 ，Option<Box<T>> 的 实际 内 部 表示 
形式 是 Option<NonZero<*const T>>。 因 此 编译 絮 就 有 能 力 将 这 个 类 型 
的 占用 空间 压缩 到 与 *const T 类 型 占用 的 空间 一 致 。 


而 对 于 *const 工 类 型 ， 它 本 喘 是 有 可 能 取 值 为 0 的 ， 因 此 这 种 类 型 
无 法 执行 优化 ， Option<*const T> 的 大 小 束 变 成 了 两 个 指针 大 小 。 大 家 
搞 明 日 这 一 点 后 ， 我 们 目 定 义 的 类 型 如 果 也 符合 同样 的 条 件 ， 也 可 以 
利用 这 个 特性 来 完成 优化 。 


总 结 起 来 ， 对 于 Rust 中 的 Option 类 型 ， 读 者 需要 注意 以 下 几 点 。 


1) 如 打从 逻辑 上 说 ， 我 们 需要 一 个 变量 确实 是 可 空 的 ， 那 么 就 应 
该 显 式 标明 其 类 型 为 Option<T>， 否 则 应 该 直接 声明 为 T 类 型 。 从 类 型 
系统 的 角度 来 说 ， 这 二 者 有 本 质 区 别 ， 切 不 可 混为一谈 。 


2) 不 要 轻易 使 用 unwrap 方 法 。 这 个 方法 可 能 会 导致 程序 发 生 
panic。 对 于 小 工具 来 说 无 所 谓 ， 在 正式 项 目 中 ， 最 好 是 使 用 lint 工 具 强 
制 禁止 调用 这 个 方法 。 

3) 相对 于 裸 指针 ， 使 用 Option 包 装 的 指针 类 型 的 执行 效率 不 会 降 
低 ， 这 是 “ 零 开销 抽象 ”。 


4) 不 必 担 心 这 样 的 设计 会 导致 大 量 的 match 语 句 ， 使 得 程序 可 读 
性 变 靶 。 因 为 Option<T> 类 型 有 许多 方便 的 成 员 画 数 ， 表 配合 上 闭 包 历 
能 ， 实 际 上 在 表达 能 力 和 可 读 性 上 要 更 胜 一 筹 。 


“ 宏 ” (macro) 是 Rust 的 一 个 重要 特性 。Rust 的 “ 宏 ”(macro) 是 一 
种 编译 器 扩展 ， 它 的 调用 方式 为 some_macro! (...) 。 宏 调用 与 普通 
函数 调用 的 区 别 可 以 一 眼 区 分 开 来 ， 凡 是 宏 调 用 后 面 都 跟着 一 个 感叹 
号 。 安 也 可 以 通过 some_macro! [...] 和 some_macro! {...} 两 种 语法 调 
用 ， 只 要 括号 能 正确 匹配 即 可 。 我 们 在 本 书 一 开始 承 已 经 使 用 
本" 安 ”"， 六 家 一 定 记得 printn! 这 个 安 ， 它 可 以 用 于 同和 标 准 答 出 打印 
子 (©) 


与 C/C++ 中 的 宏 不 一 样 的 是 ，Rust 中 的 宏 是 一 种 比较 安全 的 “卫生 
安 ”(hygiene) 。 首 先 ，Rust 的 宏 在 调用 的 时 候 跟 函数 有 明显 的 语法 区 
别 ; 其 次 ， 安 的 内 部 实现 和 外 部 调用 者 处 于 不 同名 字 空 间 ， 它 的 访问 
范围 三 格 受 限 ， 是 通过 参数 传递 进去 的 ， 我 们 不 能 随意 在 安 内 访问 和 
改变 外 部 的 代码 。C/C++ 中 的 安 只 在 预 处 理 阶段 起 作用 ， 因 此 只 能 实 
现 类 似 文 本 替换 的 功能 。 而 Rust 中 的 安 在 语 法 解析 之 后 起 作用 ， 因 此 
可 以 获取 更 多 的 上 下 文 信息 ， 而 且 更 加 安全 。 


我 们 可 以 把 “ 宏 ” 视 为 “元 编程 ”的 一 种 方式 。 它 是 一 种 “生成 程序 的 
程序 ”。 宏 有 很 多 用 处 。 


9.1.1 实现 编译 阶段 检查 
比如 我 们 用 下 面 的 方式 调用 println! 安 : 


fn main() { 
println!("number1 {} number2 {}"); 


编译 器 会 产生 一 个 编译 错误 “invalid reference to argument*0`、 (no 
arguments given) ”。 这 和 古 因 为 我 们 的 第 一 个 参数 是 一 个 字符 串 模 板 ， 
它 应 该 接受 两 个 参数 用 于 内 部 填充 ， 可 是 我 们 在 调用 的 时 候 ， 后 面 没 


有 提供 足够 的 参数 ， 因 此 出 错 。 这 个 功能 如 果 使 用 普通 钞 数 来 实现 ， 
是 不 可 能 在 编译 阶段 实现 这 样 的 错误 检查 功能 的 。 使 用 宏 ， 我 们 可 以 
在 编译 阶段 分 析 这 个 字符 串 常量 和 对 应 参数 ， 确 保 它 符合 约定 。 另 外 
一 个 稍 见 的 场景 是 ， 利 用 安 来 检查 正则 表达 式 的 正确 性 。 


9.1.2 ”实现 编译 期 计算 


比如 以 下 代码 可 以 打印 出 当前 源 代码 的 文件 名 ， 以 及 当前 代码 的 
行 数 。 这 些 信息 都 是 纯 编 译 阶段 的 信息 。 


fn main() { 
println!("file {} line {} ", file!(), line!()); 


; 在 某 些 场景 下 ， 利 用 安 来 完成 一 些 编译 期 计算 也 是 一 种 可 行 的 选 
= 


9.1.3 ”实现 上 自动 代码 生成 


有 些 情况 下 ， 许 多 代码 具有 同样 的 “模式 *”， 但 是 它们 不 能 用 现 有 
的 语法 工具 ， 如 “ 国 数 ”“ 沁 型 ”trait* 等 对 其 进行 合理 抽象 。 如 果 这 样 的 
boilerplate 代 码 数量 很 多 ， 实 际 上 意味 着 代码 违反 了 “Don’*t Repeat 
Yourself” 原 则 ， 那 么 我 们 可 以 用 “ 宏 * 来 精简 代码 ， 消 除 重 复 。 


比如 ， 在 标准 库 中 就 有 许多 类 似 的 用 法 。 在 core/ops.rs 代 码 中 ， 内 
置 类 型 对 各 种 运算 符 trait 的 支持 就 使 用 了 宏 。 


add_impl! { usize U8 U16 U32 U64 isize i8 i16 i32 i64 f32 f64 } 


这 是 各 个 内 置 类 型 实现 std: : OPS: : Add 这 个 trait 的 办 法 。 因 为 
0 所 以 可 以 将 它们 提取 到 一 个 “ 宏 " 里 面 ， 以 避免 无 
1 的 重复 。 


9.1.4 实现 语法 扩展 


某 些 情况 下 ， 我 们 可 以 使 用 宏 来 设计 比较 方便 的 “语法 糖 *， 而 不 
必 使 用 编译 絮 内 部 人 硬 编 码 来 实现 。 比 如 初始 化 一 个 动态 数组 ， 我 们 可 
以 使 用 方便 的 vec! 宏 : 


let v = vec![1, 2, 3, 4, 5]; 


简 涪 、 和 直观、 明了， 而且 不 是 编 详 器 内 部 的 “车 魔法 ”。 我 们 可 以 
充分 发 挥 目 己 的 想象 力 ， 通 过 目 定 义 宏 来 增加 语言 的 表达 能 力 ， 甚 至 
自 定 义 DSL (Domain Specific Language) 


自 定义 宏 有 两 种 实现 方式 : 
通过 标准 库 提 供 的 macro_rules! 宏 实 现 。 
.通过 提供 编译 局 扩展 来 实现 。 


编译 需 扩 展 只 能 在 不 稳定 版 本 中 使 用 。 它 的 API 正 在 重新 设计 
中 ， 还 没有 正式 定稿 这 就 是 所 谓 的 macro 2.0。 在 后 面 ， 我 们 会 体验 
macro 1.1， 它 就 是 macro 2.0 的 缩微 版 。 


下 面 我 们 来 使 用 一 个 例子 讲解 如 何 使 用 macro_rules! 实现 目 定义 
宏 。macro_rules! 是 标准 库 中 为 我 们 提供 的 一 个 编写 简单 宏 的 小 工 
具 ， 它 本 身 也 是 用 编译 器 扩展 来 实现 的 。 它 可 以 提供 一 种 “示范 
型 ”(by example) 宏 编写 方式 。 


举 个 例子 ， 我 们 考虑 一 下 这 样 的 需求 : 提供 一 个 hashmap! 安 ， 
实现 如 下 初始 化 HashMap 的 功能 : 


let counts = hashmap!['A' => 0, 'C' => 0，'G' => 0, 'T' => 0]; 
首先 ， 定 义 hashmap 这 样 一 个 宏 名 字 : 


macro_rules! hashmap { 


在 大 括号 里 面 ， 我 们 定义 宏 的 使 用 语法 ， 以 及 它 展开 后 的 形态 。 
定义 方式 类 似 match 语 句 的 语法 ，expander=>{transcriber}。 左边 的 是 宏 
扩展 的 语法 定义 ， 后面 是 宏 扩 展 的 转换 机 制 。 ee 
涉 ， 类 型 支持 item 、block、stmt、pat、expr、ty、itent、path、tt°。 我 
们 的 和 需求 是 和 需要 一 个 表达 式 ， 一 个 “=>” 标 识 人 符 ， 青 跟 一 个 表达 式 ， 天 
此 ， 宏 可 以 写成 这 样 : 


macro_rules! hashmap { 
($key: expr => $val: expr) => { 
// 暂时 空 着 
() 


现在 我 们 已 经 实现 了 一 个 hashmap ! {'A'=>'1'}; 这 样 的 语法 了 。 
我 们 希望 这 个 宏 扩 展开 后 的 类 型 是 HashMap， 而 且 进 行 了 合理 的 初始 
化 ， 那 么 我 们 可 以 使 用 “语句 块 * 的 方式 来 实现 : 


macro_rules! hashmap { 
($key: expr => $val: expr) => { 
{ 


let mut map = ::std::collections::HashMap: :new( ); 
map.insert($key, $val); 

map 

} 


} 
} 


现在 我 们 布 望 在 宏 里 面 ， 可 以 文 持 重 复 多 个 这 样 的 语法 元 素 。 我 
们 可 以 使 用 + 模式 和 * 模 式 来 完成 。 类 似 正则 表达 式 的 概念 ，+ 代 表 一 
个 或 者 多 个 重复 ，* 人 代表 零 个 或 者 多 个 重复 。 因 此 ， 我 们 需要 把 需要 重 
复 的 部 分 用 括号 括 起 来 ， 并 加 上 过 号 分 隅 符 : 


macro_rules! hashmap { 
($( $key: expr => $val: expr ),*) => {{ 


let mut map = ::std::collections::HashMap: :new(); 
map.insert($key, $val); 
map 


}} 
} 


最 后 ， 我 们 在 语法 扩展 的 部 分 也 使 用 * 符 号 ， 将 
条 insert 语 句 。 最 终 的 结果 如 下 所 示 : 


输入 部 分 扩展 为 多 


macro_rules! hashmap { 
($( $key: expr => $val: expr ),*) => {{ 


let mut map = ::std::collections::HashMap: :new(); 
$( map.insert($key, $val); )* 
map 


}} 
} 


fn main() { 


let counts = hashmap!['A' => 0, 'C' => 0，'G' => 0, 'T' => 0]; 


println!("{:?}", counts); 


一 个 目 定 义 宏 束 诞生 了 。 如 果 我 们 想 检 查 一 下 宏 展 开 的 情况 是 否 
正确 ， 可 以 使 用 如 下 rustc 的 内 部 命令 : 


rustc -Z unstable-options --pretty=expanded temp ,rs 


可 以 看 到 ，hashmap! 宏 展 开 后 的 结果 是 : 


Jet counts = 


let mut map = ::std::collections::HashMap: :new(); 
map.insert('A', 0); 

map.insert('C', 0); 

map.insert('G', 0); 

map.insert('T', 0); 

map 


}; 


很 大 一 部 分 安 的 需求 我 们 都 可 以 通过 这 种 方式 实现 ， 它 比较 适合 
写 那 种 一 个 模子 套 出 来 的 重复 代码 。 


9.3 宏 1.1 


对 于 一 些 人 简单 的 宏 ， 这 种 “示例 型 ” (by example) 的 方式 足够 使 用 
了 。 但 是 更 复杂 的 逻辑 则 需要 通过 更 复杂 的 方式 来 实现 ， 这 就 是 所 谓 
的 “过 程 安 ” (procedural macro) 。 它 是 直接 用 Rust 语 言 写 出 来 的 ， 相 
当 于 一 个 编译 器 插件 。 但 是 编译 器 插件 的 最 大 问题 是 ， 它 依赖 于 编译 
器 的 内 部 实现 方式 。 一 旦 编译 器 内 部 有 所 变化 ， 那 么 对 应 的 宏 就 有 可 
能 出 现 编译 错误 ， 需 要 修改 。 因 此 ，Rust 中 的 “ 宏 ” 一 直 难 以 稳定 。 


所 以 ，Rust 设 计 痢 希望 提供 一 套 相 对 稳定 一 点 的 API， 它 基本 跟 
rustc 的 内 部 数据 结构 解 厢 。 这 个 设计 就 是 macro 2.0。 这 个 功能 目前 暂 
时 还 没完 成 。 但 是 ，Rust 提 前 推出 了 一 个 macro 1.1 版 本 。 我 们 在 1.15 
正式 版 中 可 以 体验 一 下 这 个 功能 的 概 狐 。 所 谓 的 macro 1.1 是 按照 2.0 的 
思路 专门 为 自动 derive 功 能 设计 的 ， 是 一 个 缩微 版 的 macro 2.0。 


在 Rust 中 ，attribute 也 是 一 种 特殊 的 宏 。 在 编译 絮 内 部 ，attribute 和 
macro 并 没有 本 质 的 区 别 ， 它 们 都 是 所 谓 的 编译 絮 扩 展 。 在 以 后 的 
macro 2.0 中 ， 我 们 也 可 以 用 类 似 的 API 设 计 目 定义 attribute。 目 前 有 一 
个 叫 作 derive 的 attribute 是 最 常用 的 ， 最 需要 文 持 目 定义 扩展 。 专 门 为 
支持 自 定义 derive 的 功能 ， 就 是 macro 1.1。derive 功 能 我 们 在 trait 一 章 
中 已经 讲 过 了 ，attribute 可 以 让 编译 絮 帮 我 们 上 自动 impl 某 些 trait 。 


目前 ， 编译 器 的 derive 只 文 持 一 小 部 分 固定 的 trait o 但 我 们 可 以 通 
过 自 定义 宏 实 现 扩展 derive。 下 面 ， 我 们 用 一 个 示例 来 演示 一 下 如 何 使 
用 macro 1.1 完 成 自 定 义 #[derive (HelloWorld) ] 功 能 。 


目 和 完 ， 需 要 把 编译 工具 升级 到 最 新 的 nightly 版 本 。 然 后 创建 两 个 
项 目 : 一 个 是 实现 宏 ， 一 个 使 用 安 。 


$ cargo new --bin hello-world 
$ cd hello-world 
$ cargo new hello-world-derive 


在 hello-world-derive 项 目的 Cargo.toml 中 ， 加 上 项 目 属性 设置 . 


[1ib] 
proc-macro=true 


在 hello-world 项 目的 Cargo.toml 中 ， 设 置 项 目 依赖 : 


[dependencies] 
hello-world-derive = { path = "hello-world-derive" } 


宏 项 目 编译 完成 后 ， 会 生成 一 个 动态 链接 库 。 这 个 库 会 被 编译 器 
在 编译 主 项 目的 过 程 中 调用 。 在 主 项 目 代码 中 写 上 如 下 测试 代码 : 


#[macro_use] 
extern crate hello world_derive; 


trait THelloworld { 
fn hello(); 
} 


#[derive(Helloworld)] 
struct FrenchToast,; 


fn main() { 
FrenchToast: :hello( ); 
} 


接 下 来 ， 我 们 来 实现 这 个 宏 。 它 的 代码 骨架 如 下 所 示 : 


extern crate proc_macro ; 


use proc_macro::TokenSstream; 
use std::str::Fromstr; 


#[proc_macro_derive(Helloworld)] 

pub fn hello world(input: TokenStream) -> TokenStream { 
// Construct a string representation of the type definition 
let s = input.to_string(); 


TokenStream: :from_str("").unwrap() 


我 们 的 主要 逻辑 就 写 在 hello_world 函 数 中 ， 它 需要 用 
proc_macro_derive 修 饰 。 它 的 签名 是 ， 输 入 一 个 TokenStream， 输 出 一 
个 TokenStream。 这 个 TokenStream 类 型 目前 还 没 实现 什么 有 用 的 成 员 


方法 ， 和 暂时 只 提供 了 和 字符 串 类 型 之 间 的 转换 方式 。 我 们 在 函数 中 把 
input 的 值 打 印 出 来 : 


let s = input.to_string(); 
println!("{}", s); 


编译 可 见 ， 输 出 值 为 struct FrenchToast; 。 由 些 可见， 编译 器 将 # 
[derive () Ee A 传递 给 了 我 们 这 个 编译 器 扩展 函 
数 。 我 们 需要 对 这 个 参数 进行 分 析 ， 然 后 将 希望 目 动 生 成 的 代码 作为 
返回 值 传递 出 去 。 


在 这 里 ， 我 们 引入 regex 库 来 辅助 实现 逻辑 。 在 项 目 文件 中 ， 加 入 
以 下 代码 : 


[dependencies] 
regex = "0.2" 


然后 写 一 个 贸 数 ， 把 类 型 名 字 从 输入 参数 中 提取 出 来 : 


fn parse_struct_name(S: &str) -> String 
let r = Regex::new(r"(?:struct\s+)([\w\d_]+)").unwrap(); 
let caps = r.captures(s).unwrap(); 
caps[1].to_string() 


#[test] 

fn test_parse_struct_ name() { 
let input = "Struct Foo(i32);",; 
let name = parse_struct_name(input); 
assert_eq!(&name, "Foo"); 


} 


接 下 来 ， 就 可 以 目 动 生成 我 们 的 impl 代 码 了 : 


#[proc_macro_derive(Helloworld)] 
pub fn hello world(input: TokenStream) -> TokenStream { 
let s = input.to_string(); 
let name = parse_struct_name(&s); 
Jet output = format!(r#" 
impl] THellowor]d for {0} {{ 
fn hello() {{ printljn!(" {0} says hello "); }} 
}}"#, name); 


TokenStream: :from_str(&output).unwrap() 


我 们 构造 了 一 个 字符 串 ， 然 后 将 这 个 字符 串 转 化 为 TokenStream 类 
型 返回 。 


编译 主 项 目 可 见 ，FrenchToast 类 型 已 经 有 了 一 个 hello () 方法 ， 
执行 结果 为 : 


FrenchToast says hello 


在 macro 1.1 版 本 中 ， 只 提供 了 这 么 一 点 简单 的 API。 在 接 下 来 的 
macro 2.0 版 本 中 ， 会 为 TokenStream 添 加 一 - 些 更 有 用 的 方法 ， 或 许 那 时 
候 束 没 必要 把 TokenStream 转 成 字符 串 再 自己 解析 一 裔 了 。 


第 二 部 分 ”内存 安全 


不 带 自 动 内 存 回收 (Garbage Collection) 的 内 存 安全 是 Rust 语 言 
最 重要 的 创新 ， 是 它 与 其 他 语言 最 主要 的 区 别 所 在 ， 是 Rust 语 言 设计 
的 核心 。 

Rust 希 望 通过 语言 的 机 制 和 编译 絮 的 功能 ， 把 程序 员 易 犯错 、 不 
易 检查 的 问题 解决 在 编译 期 ， 避 免 运行 时 的 内 存 错误 。 这 一 部 分 主要 
探讨 Rust 是 如 何 达 到 内 存 安全 特性 的 。 


Languages shape the way we think, or don't. 


Erik Naggum 


第 10 章 ”内存 管理 基础 
本 章 主要 介绍 没有 垃圾 回收 机 制 下 的 内 存 管理 基础 知识 。 


10.1 堆 和 栈 


一 个 进程 在 执行 的 时 候 ， 它 所 占用 的 内 存 的 虚拟 地 址 空间 一 般 被 
分 割 成 好 几 个 区 域 ， 我 们 称 为 < 段 ”\Segment) 。 常 见 的 几 个 段 如 下 。 


-代码 段 。 编 译 后 的 机 顺 码 存在 的 区 域 。 一 般 这 个 段 是 只 读 的 。 
-bss 段 。 存 放 未 初始 化 的 全 局 变量 和 静态 变量 的 区 域 。 
-数据 段 。 存 放 有 初始 化 的 全 局 变量 和 静态 变量 的 区 域 。 


.函数 调用 栈 (call stack segment) 。 存 放 函 数 参 数 、 局 部 变量 以 
及 其 他 函数 调用 相关 信息 的 区 域 。 


- 堆 (heap) 。 和 存放 动态 分 配 内 存 的 区 域 。 


函数 调用 栈 (call stack) 也 可 以 简称 为 栈 (stack) 。 因 为 函数 调 
用 栈 本 来 殴 是 基于 栈 这 样 一 个 数据 结构 实现 的 。 它 具备 “后 入 先 
出 ” (LIFO) 的 特点 。 最 先进 入 的 数据 也 是 最 后 出 来 的 数据 。 一 般 来 
说 ，CPU 有 专 | 的 指令 可 以 用 于 入 栈 或 者 出 栈 的 操作 。 当 一 个 芳 数 被 
调用 时 ， 就 会 有 指令 把 当前 指令 的 地 址 压 入 栈 内 保存 起 来 ， 然 后 跳 转 
到 被 调用 的 函数 中 执行 。 函 数 返 回 的 时 候 ， 就 会 把 栈 里 面 先 前 的 指令 
地 址 弹出 来 继续 执行 ， 如 图 10-1 所 示 。 


堆 古 为 动态 分 配 预 留 的 内 存 空间 ， 如 图 10-2 所 示 。 和 栈 不 一 样 ， 
从 堆 上 分 配 和 重新 分 配 块 没有 固定 模式 ， 用 户 可 以 在 任何 时 候 分 配 和 
释放 它 。 这 样 束 使 得 女 趴 哪 部 分 堆 已 经 被 分 配 和 被 释放 变 得 异常 复 
杂 ; 有 许多 定制 的 堆 分 配 集 略 用 来 为 不 同 的 使 用 模式 下 调整 堆 的 性 
能 。 堆 是 在 内 存 中 动态 分 配 的 内 存 ， 是 无 序 的 。 每 个 线程 都 有 一 个 
栈 ， 但 是 每 一 个 应 用 程序 通常 都 只 有 一 个 扒 。 在 堆 上 的 变量 必须 要 手 
动 释放 ， 不 存在 作用 域 的 问题 。 


Sp 


sp: stack pointer (data) 
used: unavallabjle stack 
args: function areuments 
ret: return address (code) 
locals: local variables 
free: available stack 


free blocks blocks in use 
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一 般 来 说 ， 操 作 系 统 提 供 了 在 堆 上 分 配 和 释放 内 存 的 系统 调用 ， 
但 是 用 户 不 是 直接 使 用 这 个 系统 调用 ， 而 是 使 用 封装 的 更 好 的 “内 存 分 
配器 ”(Allocator) 。 比 如 ， 在 C 语 言 里 面 ， 运 行 时 (runtime) 就 提供 
了 malloc 和 free 这 两 个 函数 可 以 管理 堆 内 存 。 

堆 和 栈 之 间 的 区 别 有 : 

. 栈 上 保存 的 局 部 变量 在 退出 当前 作用 域 的 时 候 会 自动 释放 ; 

. 堆 上 分 配 的 空间 没有 作用 域 ， 需 要 手动 释放 ; 


.一 般 栈 上 分 配 的 空间 大 小 是 编译 阶段 就 可 以 确定 的 〈C 语 言 里 面 
的 VLA 除 外 ) ， 


. 栈 有 一 个 确定 的 最 大 长 度 ， 超 过 了 这 个 长 度 会 产生 * 栈 溢 


出 ” (stack overflow) : 


: 堆 的 空间 一 般 要 更 大 一 些 ， 堆 上 的 内 存 耗 尽 了 ， 就 会 产生 “内 存 
分 配 不 足 ” (out of memory) 。 


[1] 此 图 源 于 https://stackoverfl ow.com/questions/79923/what-and-where- 
are-the-stack-and-heap ° 
[2] 此 图 源 于 https://stackoverfl ow.com/questions/79923/what-and-where- 
are-the-stack-and-heap ° 


10.2 ” 段 错 误 


我 们 再 回忆 一 下 Rust 的 主要 特点 。Rust 官 方 网 站 给 自己 的 介绍 


证 


Rust is a Systems programming language that runs blazingly fast, 
prevents segfaults, and guarantees thread safety. 


本 广 就 来 讲 一 下 什么 是 segfault， 以 及 什么 是 Rust 所 谈论 的 “内 存 安 
全 ”概念 。 


segfault 实 际 上 是 “segmentation fault” 的 缩写 形式 ， 我 们 可 以 翻译 
为 “ 段 错 误 ”。segfault 是 这 样 形成 的 :进程 空间 中 的 每 个 段 通 过 人 硬件 
MMU 了 映 冉 到 真正 的 物理 空间 ;， 在 这 个 映射 过 程 中 ， 我 们 还 可 以 给 不 同 
的 段 设 置 不 同 的 访问 权限 ， 比 如 代码 段 就 是 只 能 读 不 能 写 ; 进程 在 执 
行 过 程 中 ， 如 果 违 反 了 这 些 权 限 ，CPU 会 直接 产生 一 个 硬件 异常 ; 硬 
件 异常 会 被 操作 系统 内 核 处 理 ， 一 般 内 核 会 回 对 应 的 进程 发 送 一 条 信 
号 ; 如 果 没 有 实现 目 己 特 殊 的 信号 处 理 函 数 ， 默 认 情 况 下 ， 这 个 进程 
会 直接 非 正 常 退出 ， 如 采 操 作 系 统 打 开 了 core dump 功 能 ， 在 进程 退出 
的 时 候 操作 系统 会 把 它 当 时 的 内 存 状 态 、 寄 存 器 状态 以 及 各 种 相关 信 
忌 保 存 到 一 个 文件 中 ， 供 用 户 以 后 调试 使 用 。 


在 传统 系统 级 编程 语言 C/C++ 里 面 ， 制 造 segfault 是 很 容易 的 。 程 
序 员 需 要 非常 小 心 才能 避免 这 种 错误 ， 这 也 是 为 什么 会 有 那么 多 的 代 
码 标准 来 规范 程序 员 的 行为 。 而 另外 一 类 编程 语言 规避 segfault 的 办 法 
是 使 用 自动 垃圾 回收 机 制 。 在 这 些 编程 语言 中 ， 指 针 的 能 力 被 大 幅 限 
制 ， 内 存 分 配 和 释放 都 在 一 个 运行 时 环境 中 被 严格 管理 。 当 然 ， 这 么 
做 也 付出 了 一 定 的 代价 。 某 些 应 用 场景 下 用 这 样 的 代价 换取 开发 效率 
和 安全 性 是 非常 划算 的 ， 而 在 甘 些 应 用 场景 h 这 样 的 代价 是 不 可 接受 


Rust 的 主要 设计 目标 之 一 ， 是 在 不 用 目 动 垃圾 回收 机 制 的 前 提 下 
避免 产生 segfault。 从 这 个 意义 上 来 说 ， 它 是 独一无二 的 。 至 于 它 是 如 
何 做 到 的 ， 本 书 将 会 详细 剖析 。 


10.3 内存 安 全 


在 谈 到 Rust 的 时 候 ， 经 常会 捉 到 的 一 个 概念 ， 那 惑 是 “内 存 安 
全 ”(Memory safety) 。 内 存 安全 是 Rust 设 计 的 主要 目标 之 一 ， 因 此 我 
们 有 必要 把 这 个 概念 做 一 个 澄清 ， 让 大 家 能 更 清楚 地 理解 Rust 为 什么 
要 这 么 设计 。 


在 Wikipedia 上 ， 内 存 安全 是 这 么 定义 的 : 


Memory safety is the state of being protected from various software 
bugs and security vulnerabilities when dealing with memory access, such 
as buffer overflows and dangling pointers. 


下 面 列举 一 系列 的 “内 存 不 安全 ”的 例子 。 以 下 这 些 情况 ， 束 是 
Rust 想 要 避免 的 问题 。 

: 空 指针 

解 引 用 空 指 针 是 不 安全 的 。 这 块 地 址 空间 一 般 是 受 你 护 的 ， 对 空 
指针 解 引 用 在 大 部 分 平台 上 会 产生 segfault 。 

时 指针 


对 指针 指 的 是 未 初始 化 的 指针 。 它 的 值 取决 于 它 这 个 位 置 以 前 遗 
留 下 来 的 是 什么 值 。 所 以 它 可 能 指 癌 任意 一 个 地 方 。 对 它 解 引用 ， 可 
能 会 造成 segfault， 也 可 能 不 会 ， 纯 粹 赁 运气 。 但 无 论 如 何 ， 这 个 行为 
都 不 会 是 你 预期 内 的 行为 ， 是 一 定 会 产生 bug 的 。 


悬空 指针 指 的 是 内 存 空间 在 被 释放 了 之 后 ， 继 续 使 用 。 它 跟 野 指 
针 类 似 ， 同 样 会 读 写 已 经 不 属于 这 个 指针 的 内 容 。 
.使 用 未 初始 化 内 存 


不 只 是 指针 类 型 ， 任 何 一 种 类 型 不 初始 化 束 直 接 使 用 都 是 危险 
的 ， 造 成 的 后 采 我 们 完全 无 法 预测 。 


-非法 释放 


内 存 分 配 和 释放 要 配对 。 如 有 果 对 同一 个 指针 释放 两 次 ， 会 制造 出 
内 存 错误 。 如 采 指 针 并 不 是 内 存 分 配 右 返回 的 值 ， 对 其 执行 释放 操 
作 ， 也 是 危险 的 。 


-缓冲 区 溢出 


旨 针 访问 越界 了 ， 结 果 也 是 类 似 于 野 指 针 ， 会 读 取 或 者 修改 临近 
内 存 空 间 的 值 ， 造 成 危险 。 


-执行 非法 函数 指针 


如 采 一 个 函数 指针 不 是 准确 地 指 回 一 个 男 数 地 址 ， 那 么 调用 这 个 
函数 指针 会 导致 一 段 随 机 数据 被 当成 指令 来 执行 ， 有 是 非 浓 危险 的 。 


"数据 鞠 争 


i 在 有 并 发 的 场景 下 ， 针 对 同一 块 内 存 同 时 读 写 ， 且 没有 同步 措 
而。 


以 上 这 些 问题 都 是 极度 危险 的 ， 而 且 它 们 并 不 一 定 会 在 发 生 的 时 
候 就 被 发 现 并 立即 终止 。 它 们 不 一 定 会 直接 触发 core dump， 有 可 能 程 
序 一 直 带 病 运行 ， 只 是 结果 一 直 有 bug 但 却 无 法 找到 原因 ， 因 为 真正 的 
原因 与 表现 之 间 没 有 任何 肉眼 可 见 的 关联 关系 。 它 们 有 可 能 造成 非常 
随机 的 、 难 以 复 现 和 难以 调试 的 诡异 bug, 束 像 武林 高 手 一 样 神 出 风 
没 ， 行 踩 不 定 。 它 们 也 可 能 在 经 过 许多 步骤 之 后 最 终 触 发 core dump， 
可 展 此 时 早已 不 是 案 发 第 一 现场 ， 修复 这 种 bug 的 难度 极 高 。 


在 Rust 语 境 中 ， 还 有 一 些 内 存 错 误 是 不 算 在 “内 存 安全 ”也 畴 内 
的 ， 比 如 内 存 洪 漏 以 及 内 存 耗 尺 。 内 存 泄 漏 显 然 是 一 种 bug， 但 是 写 不 
会 直接 造成 非常 挛 重 的 后 采 ， 至 少 比 上 面 列 出 的 那些 错误 名 险 性 要 低 
一 些 ， 解 决 的 办 法 也 十 完全 不 一 样 的 。 同 样 ， 内 存 耗 尽 也 不 是 事 关 安 
全 性 的 问题 ， 出 现 内 存 耗 尽 的 时 候 ，Rust 程 序 的 行为 依然 是 确定 性 的 
和 可 控 的 《〈 目 前 版 本 下 ， 如 果 内 存 耗 尽 则 发 生 panic， 也 有 人 认为 在 这 
种 情况 发 生 的 时 候 ， 应 该 给 个 机 会 由 用 户 目 己 处 理 ， 这 种 情况 后 面 应 
该 会 有 改进 ) 。 


另外 ，panic 也 不 属于 内 存 安全 相关 的 问题 。 在 后 面 我 们 会 花 很 多 
篇 幅 来 讲解 panic。panic 和 core dump 之 间 有 重要 区 别 。panic 是 发 生 不 
可 恢复 错误 后 ， 程 序 主 动 执行 的 一 种 错误 处 理 机 制 ， 而 core dump 则 是 
程序 失控 之 后 ， 触 发 了 操作 系统 的 保护 机 制 而 被 动 退出 的 。 发 生 panic 
的 时 候 ， 此 处 就 是 确定 性 的 第 一 现场 ， 我 们 可 以 根据 call stack 信 息 很 
es 然后 修复 。panic 是 防止 更 严重 内 存 安全 错误 的 重要 
|| o 


第 11 草 ”所 有 权 和 移动 语义 


111 村 委 是 所 有 权 


拿 C 语 言 的 代码 来 打 个 比方 。 我 们 可 能 会 在 堆 上 创建 一 个 对 象 ， 
然后 使 用 一 个 指针 来 管理 这 个 对 象 : 


Foo *p = make_object("args"); 


接 下 来 ， 我 们 可 能 需要 使 用 这 个 对 象 : 


use_object(p); 


然而 ， 这 段 代码 之 后 ， 谁 能 猜 得 到 ， 指 针 p 指 向 的 对 象 究竟 发 生 了 
什么 ? 它 是 否 被 修改 过 了 ? 它 还 存在 吗 ， 是 否 已 经 被 释放 ? 是 否 有 另 
外 一 个 指针 现在 也 同时 指向 这 个 对 象 ? 我 们 还 能 继续 读 取 、 修 改 或 者 
释放 这 个 对 象 吗 ? 实际 上 ， 除 了 去 了 解 use_object 的 内 部 实现 之 外 ， 我 
们 没 办 法 回答 以 上 问题 。 

对 此 ，C++ 进 行 了 一 个 改进 ， 即 通过 “智能 指针 ?来 描述 < 所 有 
权 ” (Ownership) 概念 。 这 在 一 定 程度 上 减少 了 内 存 使 用 bug， 实 现 
了 “半自动 化 ”的 内 存 管理 。 而 Rust 在 此 基础 上 更 进一步 ， 将 “所 有 
权 ” 的 理念 直接 融入 到 了 语言 之 中 。 

“所 有 权 ” 代 表 着 以 下 意义 : 


每 个 值 在 Rust 中 都 有 一 个 变量 来 管理 它 ， 这 个 变量 就 是 这 个 值 、 
这 块 内 存 的 所 有 者 ; 


-每 个 值 在 一 个 时 间 点 上 只 有 一 个 管理 者 ; 
当 变 量 所 在 的 作用 域 结束 的 时 候 ， 变 量 以 及 它 代表 的 值 将 会 被 销 


1 
毁 。 


拿 前 面 已 经 讲 过 的 子 符 串 String 类 型 来 举例 : 


fn main() { 
let mut s = String::from("hello"); 
s.push_str(" world"),; 
println!("{}", s); 


当 我 们 声明 一 个 变量 s， 并 用 String 类 型 对 它 进行 初始 化 的 时 候 ， 
这 个 变量 s 束 成 了 这 个 字符 串 的 “所 有 者 ”。 如 果 我 们 希望 修改 这 个 变 
量 ， 可 以 使 用 mut 修 饰 s， 然 后 调用 String 类 型 的 成 员 方 法 来 实现 。 当 
main 芳 数 结束 的 时 候 ，s 将 会 被 析 构 ， 它 管理 的 内 存 (不 论 是 堆 上 的 ， 
还 是 栈 上 的 ) 则 会 被 释放 。 

我 们 一 般 把 变量 从 出 生 到 死亡 的 整个 阶段 ， 叫 作 一 个 变量 的 “生命 
周期 *。 比 如 这 个 例子 中 的 局 部 变量 s， 它 的 生命 周期 就 是 从 let 语 句 开 
台 ， 到 main 函 数 结 


在 上 述 示例 的 基础 上 ， 大 做 一 点 修改 : 


fn main() { 
let s = String::from("hello"); 
let si = s; 
println!("{}", s); 


编译 ， 可 见 : 


error[E0382]: Use of moved value: 's. 
--> test.rs:5:20 


| 
| 
| -- Value moved here 
| 
| 


4 let S1 = s; 
5 println!("{}", s); 


人 ^ Value used here after move 


= note: move occurs because ‘s has type ‘std::string::String’, which does not 
implement the ‘Copy trait 


这 里 出 现 了 编译 错误 。 编 译 器 显示 ， 在 let sl1=s; 语句 中 ， 原 本 由 s 
1 。 所 以 ， 后 面 继续 使 用 s 是 不 对 


也 就 是 前 面 所 说 的 每 个 值 只 有 一 个 所 有 者 。 变 量 s 的 生命 周期 从 声 
明 开 始 ， 到 move 给 s1 就 结束 了 。 变 量 s1 的 生命 周期 则 是 从 它 声 明 开 
始 ， 到 辑 数 结束 。 而 字符 串 本 时 ， 由 String: : from 函 数 创 建 出 来 ， 到 
函数 结束 的 时 候 束 会 销毁 。 中 间 所 有 权 的 转换 ， 并 不 会 将 这 个 字符 串 
本 喘 重 新 销毁 再 创建 。 在 任意 时 刻 ， 这 个 字符 串 只 有 一 个 所 有 者 ， 要 


么 是 s， 要 么 是 s1。 


请 注意 ，Rust 的 赋值 和 C++ 的 赋值 有 重大 区 别 。 如 采 我 们 用 C++ 来 
实现 上 面 这 个 例子 的 话 ， 程 序 如 下 : 


#include <iostream> 
using namespace std; 


int main() { 
string s("hello"); 
string S1 = s,; 
cout << s << endl; 
cout << S1 << endl; 
return ©; 


在 用 变量 s 初 始 化 sl 的 时 候 ， 并 不 会 造成 s 的 生命 周期 结束 。 这 里 
只 会 调用 string 类 型 的 复制 构造 函数 复制 出 一 个 新 的 字符 串 ， 于 是 在 后 
面 S1 和 s 都 是 合法 变量 。 在 Rust 中 ， 我 们 要 模拟 这 一 行为 ， 需 要 手动 调 
用 clone () 方法 来 完成 : 


fn main() { 
let s = String::from("hello"); 
let si = s.clone(); 
println!("{} {}", s, s1); 


在 Rust 里 面 ， 不 可 以 做 “赋值 运算 符 重 载 >， 若 需要 “ 深 复 制 ”， 必 
须 手 工 调 用 Clone 方法 这 个 done 方 法 来 自 于 std: : clone: : Clone 这 
个 trait。clone 方 法 里 面 的 行为 是 可 以 自 定义 的 。 


11.2 移动 语义 


一 个 变量 可 以 把 它 拥有 的 值 转 移 给 为 外 一 个 变量 ， 称 为 “所 有 权 转 
移 ”。 峰值 语句 ` 函数 调用 、 画 数 返回 等 都 有 可 能 导致 所 有 权 转 移 。 


比如 : 


fn create() -> String { 
let s = String::from("hello"); 
return s; // 所 有 权 转 移 , 从 函数 内 部 移动 到 外 部 


fn consume(s: String) { // 所 有 权 转 移 , 从 函数 外 部 移动 到 内 部 
printin!("{}", s); 


fn main() { 
let s = create(); 
consume(s); 


在 上 面 这 个 例子 中 ， 函 数 参数 、 芳 数 返 回 都 发 生 了 所 有 权 转 移 ， 
转移 的 过 程 可 以 用 图 11-1 表 示 。 


所 有 权 转 移 的 步骤 分 解 如 下 。 
1) main 函 数 调用 create 函 数 。 


2) 在 调用 create 函 数 的 时 候 创建 了 字符 串 ， 在 栈 上 和 扒 上 都 分 配 
有 内 存 。 局 部 变量 s 是 这 些 内 存 的 所 有 者 。 


3) create 图 数 返回 的 时 候 ， 需 要 将 局 部 变量 s 移 动 到 函数 外 面 ， 这 
个 过 程 束 是 简单 地 按 字 市 复制 memcpy。 
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main 
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main 
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main 
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b) 因数 参数 所 有 权 转 移 
图 11-1 


4) 同 理 ， 在 调用 consume 函 数 的 上 时候， 需要 将 main 函 数 中 的 局 部 
变量 转移 到 consume 函 数 ， 这 个 过 程 也 是 简单 地 按 字 节 复制 memcpy。 


5) 当 consume 函 数 结束 的 时 候 ， 人 它 并 没有 把 内 部 的 局 部 变 量 再 转 
移出 来 ， 这 种 情况 下 ， consume 门 部 局部 变 量 的 生命 周期 束 该 结束 了 。 
这 个 局 部 变量 s 生 命 周 期 结束 的 时 候 ， 会 自动 释放 它 所 拥有 的 内 存 ， 因 
此 字符 串 也 就 被 释放 了 。 


Rust 中 所 有 权 转 移 的 重要 特点 是 ， 它 是 所 有 类 型 的 默认 语义 。 这 
是 许多 读者 一 开始 不 习惯 的 地 方 。 这 里 再 重复 一 届 ， 请 大 家 牢 牢 记 
住 ，Rust 中 的 变量 绑 定 操作 ， 默 认 是 move 语 义 ， 执 行 了 新 的 变量 绑 定 
后 ， 原 来 的 变量 就 不 能 再 被 使 用 ! 一 定 要 记 住 ! 


Rust 的 这 一 规定 非常 有 利于 编译 絮 静 态 检 查 。 与 之 相对 的 ，C++ 的 
做 法 束 不 一 样 了 ， 它 允许 赋值 构造 国 数 、 赋 值 运 算 符 重 载 ， 因 此 在 出 
现 “ 构 造 ? 或 者 “赋值 ?操作 的 时 候 ， 有 可 能 表达 的 是 完全 不 同 的 舍 义 ， 这 
取决 于 程序 员 如 何 实 现 重 载 。C++ 的 这 个 设计 具有 巨大 的 灵活 性 ， 但 是 
不 恰当 的 实现 也 可 能 造成 内 存 不 安全 。 而 Rust 的 这 一 设计 大 幅 降 低 了 语 
言 的 复杂 度 , “移动 语义 ”不 可 能 执行 用 户 的 自 定 义 代码 ， 没 有 任何 内 
存 安全 风险 ， 而 且 满 足 异 常安 全 。 在 C++ 里 面 ，std: : 
vector<int>v1=v2， 是 复制 语义 ， 而 Rust 里 面 的 let V1: Vec<i32>=v2; 是 
移动 语义 。 如 果 要 在 Rust 里 面 实现 复 制 语 义 ， 需 要 显 式 写 出 函数 调用 let 
V1: Vec<i32>=v2.clone () ; 。 如 果 我 们 在 C++ 中 实现 移动 语义 ， 则 需 
要 用 户 目 定义 实现 移动 构造 印 数 及 移动 赋值 运算 伯 。 


对 于 “移动 语义 ”， 最 后 还 需要 强调 的 一 点 是 ，“ 语 义 ” 不 代表 最 终 的 
执行 效率 。“ 语 义 ” 只 是 规定 了 什么 样 的 代码 是 编译 器 可 以 接受 的 ， 以 
及 它 执行 后 的 效果 可 以 用 怎样 的 思维 模型 去 理解 。 编 译 器 有 权 在 不 改 
变 语义 的 情况 下 做 任何 有 利于 执行 效率 的 优化 。 语 义 和 优 化 是 两 个 阶 
段 的 事情 。 我 们 可 以 把 移动 语义 想象 成 执行 了 一 个 memcpy， 但 真实 的 
汇编 代码 未 必 如 此 。 比 如 : 


fn create() -> Bigobject { 
let local = ...; 
return local,; 


let v = create(); 


完全 可 能 被 优化 为 类 似 如 下 的 效 来 : 


fn create(p: &mut Bigobject) { 
ptr::write(p, ...); 


let mut v: Bigobject = uninitialized(); 
create(&mut v); 


编译 器 可 以 提前 在 当前 调用 栈 中 把 大 对 象 的 空间 分 配 好 ， 然 后 把 
这 个 对 象 的 指针 传递 给 子 函 数 ， 由 子 函 数 执行 这 个 变量 的 初始 化 。 这 
样 束 避 免 了 大 对 象 的 复制 工作 ， 参 数 传递 只 是 一 个 指针 而 已 。 这 么 做 
， 而 且 编 译 右 还 有 权利 做 更 多 类 似 的 优 


11.3 复制 语义 


默认 的 move 语 义 是 Rust 的 一 个 重要 设计 ， 但 是 任何 时 候 需 要 复制 
都 去 调用 clone 函 数 会 品 得 非常 烦琐 。 对 于 一 些 简单 类 型 ， 比 如 整数 、 
bool， 让 它们 在 赋值 的 时 候 默 认 采 用 复制 操作 会 让 语言 更 简单 。 


比如 下 面 这 个 程序 束 可 以 正常 编译 通过 : 


fn main() { 
et v1 : isize = 0; 
let v2 = v1; 
println!("{}", v1); 


编译 需 并 没有 阻止 v1 被 使 用 ， 这 二 为 什么 呢 ? 


因为 在 Rust 中 有 一 部 分 “特殊 照顾 ”的 类 型 ， 其 变量 绑 定 操作 是 
copy 语 义 。 所 谓 的 copy 语 义 ， 是 指 在 执行 变量 绑 定 操作 的 时 候 ，v2 是 
对 v1 所 属 数 据 的 一 份 复 制 。v1 所 管理 的 这 块 内 存 依 然 存 在 ， 并 未 失 
效 ， 而 v2 是 新 开辟 了 一 块 内 存 ， 它 的 内 容 是 从 v1 管 理 的 内 存 中 复制 而 
来 的 。 和 手动 调用 clone 方 法 效果 一 样 ，let v2=v1; 等 效 于 let 


V2=vl.clone () ; 。 


使 用 文件 系统 来 打 比 方 。copy 语 义 驶 像 * 复 制 、 粘 贴 ? 操 作 。 操 作 
完成 后 ， 原 来 的 数据 依然 存在 ， 而 新 的 数据 是 原来 数据 的 复制 品 。 
move 语 义 束 像 “ 训 切 、 烙 贴 ”操作 。 操 作 完 成 后 ， 原 来 的 数据 瑟 不 存在 
了 ， 被 移动 到 了 新 的 地 方 。 这 两 个 操作 本 吴 是 一 样 的 ， 都 是 简单 的 内 
存 复制 ， 区 别 在 于 复制 完 以 后 ， 原 先 那 个 变量 的 生命 周期 古 否 结束 。 


Rust 中 ， 在 普通 变量 绑 定 、 画 数 传 参 、 模 式 匹配 等 场景 下 ， 凡 是 
实现 了 std: : marker: : Copy trait 的 类 型 ， 都 会 执行 copy 语 义 。 基 本 
类 型 ， 比 如 数字 、 字 从、bool 等 ， 都 实现 了 Copy trait， 因 此 具备 copy 
语义 。 


对 于 目 定义 类 型 ， 移 认 是 没有 实现 Copy trait 的 ， 但 是 我 们 可 以 手 
动 添上 。 示 例如 下 : 


Struct Foo { 
data : i32 
} 


impl Copy for Foo {} 


fn main() { 
let vi = Foo { data : 0 }; 
let v2 = v1; 
println!("{:?}", vi.data); 


编译 错误 。 错 误 信息 是 “the traitcore: : clone: : Clone'is not 
implemented for the type`"Foo”。 碍 一 下 文档 发 现 ， 原 来 Copy 继 承 了 
Clone， 我 们 要 实现 Copy trait 必 须 同 时 实现 Clone trait。 把 代码 改 成 : 


Struct Foo { 
data : i32 
} 


impl] Clone for Foo { 
fn clone(&self) -> Foo { 
Foo { data : self.data } 
} 
} 


impl Copy for Foo {} 


fn main() { 
let vi = Foo { data : 0 }; 
let v2 = v1; 
println!("{:?}", vi.data); 


编译 通过 。 现 在 0 人 "在 执行 变量 绑 定 、 
函数 参数 传递 的 时 候 ， 原 来 的 变量 不 会 失效 ， 而 征 会 靳 开辟 一 块 内 
存 ， 将 原来 的 数据 复制 过 来 。 


绝 大 部 分 情况 下 ， 实 现 Copy trait 和 Clone trait 是 一 个 非常 机 械 化 
的 、 重 复 性 的 工作 ，clone 方 法 的 函数 体 要 对 每 个 成 员 调 用 一 下 clone 方 
法 。Rust 提 供 了 一 个 编译 器 扩展 derive attribute， 来 帮 有 我 们 写 这 些 代 
码 ， 其 使 用 方式 为 #[derive (Copy，Clone) ]。 只 要 一 个 类 型 的 所 有 成 
员 都 具有 Clone trait， 我 们 束 可 以 使 用 这 这 各 方法 来 让 编译 器 大 我 们 呈现 


Clone trait 了 。 


示例 如 下 : 


#[derive(Copy, Clone)] 
struct Foo { 

data : i32 
} 


fn main() { 
let vi = Foo { data : 0 }; 
let v2 = v1; 
println!("{:?}", vi.data); 


11.4 ”Box 类 型 


Box 类 型 是 Rust 中 一 种 常用 的 指针 类 型 。 它 代表 “拥有 所 有 权 的 指 
针 ”， 类 似 于 C++ 里 面 的 unique_ptr (严格 来 说 ，unique_ptr<T> 更 像 
Option<Box<T>>) 。 用 法 如 下 : 


struct T{ 
value: i32 


fn main() { 
let p = Box::new(T{value: 1}); 
println!i("{}", p.value); 

} 


”Box 类 型 永远 执行 的 是 move 语 义 ， 不 能 是 copy 语 义 。 原因 大 家 想 
想 束 可 以 明 日 ， Rust 中 的 copy 语 义 残 是 浅 复制 。 对 于 Box 这 样 的 类 型 而 
言 ， 浅 复制 必然 会 造成 二 次 释放 问题 。 


对 于 Rust 里 面 的 所 有 变量 ， 在 使 用 前 一 定 要 合理 初始 化 ， 否 则 会 
出 现 编译 错误 。 对 于 Box<T>/&T/&mut T 这 样 的 类 型 ， 合 理 初始 化 意 
味 着 它 一 定 指向 了 某 个 具体 的 对 象 ， 不 可 能 是 空 。 如 果 用 户 确实 需 
要 “可 能 为 空 的 指针， 必须 使 用 类 型 Option<Box<T>>。 


Rust 里 面 还 有 一 个 保留 关键 字 box (注意 是 小 写 ) 。 它 可 以 用 于 把 


变量 “ 厂 箱 ”到 堆 上 。 目前 这 个 语法 依然 是 unstable 状 人 态 ， 需 要 打开 


feature gate 才 能 使 用 ， 示 例如 下 : 


#![feature(box_syntax)] 


struct T{ 
value: i32 


fn main() { 
let p : Box<T> = box T{value: 1}; 


println!i("{}", p.value); 
} 


这 种 写法 和 Box: : new () 琅 数 调用 并 没有 本 质 区别 。 将 来 box 
关键 字 可 能 会 同样 支持 各 种 智能 指针 ， 从 而 根据 上 下 文 信息 自动 判断 
执行 。 比 如 let p: Rc<T>=box T{value: 1}; 束 可 以 构造 一 个 Rc 指针 。 


11.5 Clone VS.Copy 


Rust 中 的 Copy 古 一 个 特殊 的 trait， 它 给 类 型 提供 了 “复制 * 语 义 。 在 
Rust 标 准 库 里 面 ， 还 有 一 个 跟 它 很 相近 的 trait， 叫 作 Clone。 很 多 人 容 
易 把 这 两 者 混淆 ， 本 节 专 门 来 谈 一 谈 这 两 个 trait。 


11.5.1 ” Copy 的 含义 


Copy 的 全 名 是 std: : marker: : Copy。 请 大 家 注意 ，std: : 
marker 模 块 里 面 所 有 的 trait 都 是 特殊 的 trait。 目 前 稳定 的 有 四 个 ， 它 们 
是 Copy、Send、Sized、Sync。 它们 的 特殊 之 处 在 于 : 它们 是 跟 编 译 絮 
密切 绑 定 的 ，imp] 这 些 trait 对 编译 忆 的 行为 有 重要 影响 。 在 编译 器 眼 
里 ， 它 们 与 其 他 的 trait 不 一 样 。 这 几 个 trait 内 部 都 没有 方法 ， 它 们 的 唯 
一 任务 是 给 类 型 打 一 个 “标记 ”， 表 明 它 符合 某 种 约定 一 一 这 些 约定 会 
影响 编译 絮 的 静态 检查 以 及 代码 生成 。 


Copy 这 个 trait 在 编译 右 的 眼 里 代表 的 是 什么 意思 呢 ? 人 简单 点 总 结 
就 是 ， 如 果 一 个 类 型 impl 了 Copy trait， 意 味 着 任何 时 候 ， 我 们 都 可 以 
通过 简单 的 内 存 复制 (在 C 语 言 里 按 字 节 复制 memcpy) 实现 该 类 型 的 
复制 ， 并 且 不 会 产生 任何 内 存 安全 问题 。 


一 旦 一 个 类 型 实现 了 Copy trait， 那 么 它 在 变量 绑 定 、 画 数 参 数 伟 
递 、 函 数 返 回 值 传 递 等 场景 下 ， 都 是 copy 语 义 ， 而 不 再 是 默认 的 move 


语义 。 


下 面 用 最 简单 的 赋值 语句 x=y 来 说 明 move 语 义 和 copy 语 义 的 根本 
区 别 。move 语 义 是 “ 剪 切 、 粘 贴 ? 操 作 ， 变 量 y 把 所 有 权 递 区 给 了 x 之 
后 ，y 束 彻底 失效 了 ， 后 面 继续 使 用 y 了 驶 会 出 编译 错误 。 而 copy 语 义 
是 “复制 、 粘 贴 ? 操 作 ， 变 量 y 把 所 有 权 递 交 给 了 x 之 后 ， 它 目 己 还 留 了 
一 个 副本 ， 在 这 句 赋 值 语句 之 后 ，x 和 y 依 然 都 可 以 继续 使 用 。 


在 Rust 里 ，move 语 义 和 copy 语 义 具 体 执行 的 操作 ， 是 不 允许 由 程 
序 员 目 定 义 的 ， 这 是 它 和 C++ 的 巨大 区 别 。 这 里 没有 赋值 构造 函数 或 
者 赋值 运算 符 重 载 。move 语 义 或 者 copy 语 义 都 是 执行 的 memcpy， 无 
法 更 改 ， 这 个 过 程 中 绝对 不 存在 其 他 副作用 。 当 然 ， 这 里 一 直 谈 的 


古 “ 语 义 ”， 而 没有 涉及 编译 器 优化 。 从 语义 的 角度 ， 我 们 要 讲 清 楚 ， 
什么 样 的 代码 在 编译 万 看 来 是 合法 的 ， 什 么 样 的 代码 是 非法 的 。 如 采 
考虑 后 端 优化 ， 在 许多 情况 下 ， 不 必要 的 内 存 复制 实际 上 已 经 彻 撒 优 
化 掉 了 ， 大 家 不 必 担 心 执行 效率 的 问题 。 也 没有 必要 每 次 都 把 move 或 
者 copy 操 作 与 具体 的 汇编 代码 联系 起 来 ， 因 为 场景 不 同 ， 优 化 结果 不 
同 ， 生 成 的 代码 也 是 不 同 的 。 大 家 只 需 记 住 的 是 语义 。 


11.5.2 Copy 的 实现 条 件 


并 不 是 所 有 的 类 型 都 可 以 实现 Copy trait 。 Rust 规 定 和 目 定义 
类 型 ， 只 有 所 有 成 员 都 实现 了 Copy trait， 这 个 类 型 才 有 资格 实现 Copy 


trait ° 


常见 的 数字 类 型 、bool 类 型 、 共 享 借用 指针 &， 都 是 具有 Copy 属 
性 的 类 型 。 而 Box、Vec、 可 写 借用 指针 &mnut 等 类 型 都 是 不 具备 Copy 
属性 的 类 型 。 


对 于 数组 类 型 ， 如 果 它 内 部 的 元 素 类 型 是 Copy， 那 么 这 个 数组 也 
是 Copy 类 型 。 


对 于 元 组 tuple 类 型 ， 如 有 果 它 的 每 一 个 元 素 都 是 Copy 类 型 ， 那 么 这 
个 tuple 也 是 Copy 类 型 。 


struct 和 和 enum 类 型 不 会 自动 实现 Copy trait。 只 有 当 struct 和 enum 内 
部 的 每 个 元 素 都 是 Copy 类 型 时 ， 编 译 絮 才 人 允许 我 们 针对 此 类 型 实现 
Copy trait。 比 如 下 面 这 个 类 型 ， 虽 然 它 的 成 员 是 Copy 类 型 ， 但 它 本 号 
不 是 Copy 类 型 : 


Struct T(i32); 


fn main() { 


编译 可 见 编译 错误 。 原 因 是 在 let t2=t1， 这 条 语句 中 执行 的 是 
move 语 义 。 但 是 我 们 可 以 手动 为 它 impl Copy trait， 这 样 它 承 具 备 了 


copy 语 义 。 


我 们 可 以 认为 ，Rust 中 只 有 POD (C++ 语 言 中 的 Plain Old Data) 
类 型 才 有 资格 实现 Copy trait。 在 Rust 中 ， 如 果 一 个 类 型 只 包含 POD 数 
据 类 型 的 成 员 ， 并 且 没 有 目 定 义 析 构 函数 ， 那 它 承 是 POD 类 型 。 比 
如 : 整数 、 浮 点 数 、 只 包含 POD 类 型 的 数组 等 ， 都 属于 POD 类 型 ， 而 
Box String Vec 等 不 能 按 字 太 复 制 的 类 型 ， 都 不 属于 POD 类 型 。 但 是 ， 
反 过 来 讲 ， 也 并 不 是 所 有 满足 POD 的 类 型 都 应 该 实现 Copy trait， 是 否 
实现 Copy 取 决 于 业务 需求 。 


11.5.3 Clone 的 含义 
Clone 的 全 名 是 std: : done: : Clone。 它 的 完整 声明 如 下 : 


pub trait Clone : Sized { 
fn clone(&self) -> Self; 
fn clone_from(&mut self, source: &Self) { 
*self = source.clone() 
} 
} 


它 有 两 个 关联 方法 ， 分 别 是 clone_from 和 clone，clone_from 是 有 默 
认 实 现 的， 依赖 于 clone 方 法 的 实现 。clone 方 法 没有 默认 实现 ， 需 要 手 
动 实现 。 


clone 方 法 一 般 用 于 “基于 语义 的 复制 操作。 所以， 它 做 什么 事 
情 ， 跟 具体 类 型 的 作用 恩 恩 相关 。 比 如， 对 于 Box 类 型 ，clone 执 行 的 
是 “ 深 复 制 >， 而 对 于 Rc 类 型 ，clone 做 的 事情 就 是 把 引用 计数 值 加 1 。 


虽然 Rust 中 的 clone 方 法 一 般 是 用 来 执行 复制 操作 的 ， 但 是 如 采 在 
目 定义 的 clone 函 数 中 做 点 别 的 什么 工作 ， 编 译 右 也 没 办 法 禁止 。 你 可 
以 根据 需要 在 clone 函 数 中 编写 任意 的 逻辑 。 


但 是 有 一 条 规则 需要 注意 : 对 于 实现 了 copy 的 类 型 ， 它 的 clone 方 
法 应 该 跟 copy 语 义 相 容 ， 等 同 于 按 字 他 复制 。 


11.5.4 ”自动 derive 


绝 大 多 数 情 况 下 ， 实 现 Copy Clone 这 样 的 trait 都 是 一 个 重复 而 无 聊 
的 工作 。 因 此 ，Rust 提 供 了 一 个 attribute， 让 我 们 可 以 利用 编译 器 自动 
生成 这 部 分 代码 。 示 例如 下 : 


#[derive(Copy, Clone)] 
struct MyStruct(i32),; 


这 里 的 derive 会 让 编译 右 帮 我 们 自动 生成 impl Copy 和 impl Clone 这 
样 的 代码 。 目 动 生成 的 clone 方 法 ， 会 依次 调用 每 个 成 员 的 clone 方 法 。 


通过 derive 方 式 目 动 实 现 Copy 和 手工 实现 Copy 有 微小 的 区 别 。 当 
类 型 具有 泛 型 参数 的 时 候 ， 比 如 struct MyStruct<T>{}， 通 过 derive 目 动 
生成 的 代码 会 目 动 添加 一 个 T: Copy 的 约束 。 


目前 ， 只 有 一 部 分 固定 的 特殊 trait 可 以 通过 derive 来 自动 实现 。 将 
来 Rust 会 人 允许 自 定义 的 derive 行 为 ， 让 我 们 自己 的 trait 也 可 以 通过 derive 
的 方式 目 动 实现 。 


11.5.5 总 结 


Copy 和 Clone 两 者 的 区 别 和 联系 如 下 。 
:Copy 内 部 没有 方法 ，Clone 内 部 有 两 个 方法 。 


.Copy trait 是 给 编译 器 用 的 ， 告 诉 编译 絮 这 个 类 型 默认 采用 copy 语 
义 ， 而 不 是 move 语 义 。Clone trait 是 给 程序 员 用 的 ， 我 们 必须 手动 调用 
clone 方 法 ， 它 才能 发 挥 作 用 。 


:Copy trait 不 是 想 实现 就 能 实现 的 ， 它 对 类 型 是 有 要 求 的 ， 有 些 类 
型 不 可 能 impl Copy。 而 Clone trait 则 没有 什么 前 提 条 件 ， 任 何 类 型 都 可 
以 实现 (unsized 类 型 除外 ， 因 为 无 法 使 用 unsized 类 型 作为 返回 值 ) 


:Copy trait 规 定 了 这 个 类 型 在 执行 变量 绑 定 、 函 数 参数 传递 、 男 数 
返回 等 场景 下 的 操作 方式 。 即 这 个 类 型 在 这 种 场景 下 ， 必 然 执 行 的 
是 “人 简单 内 存 复 制 * 操 作 ， 这 是 由 编译 器 保证 的 ， 程 序 员 无 法 控制 。 
Clone trait 里 面 的 clone 方 法 完 莞 会 执行 什么 操作 ， 则 是 取决 于 程序 员 有 自 
己 写 的 逻辑 。 一 般 情况 下 ，dlone 方 法 应 该 执行 一 个 “ 深 复 制 * 操 作 ， 但 


这 不 是 强制 性 的 ， 如 果 你 愿意 ， 在 里 面 启 动 一 个 人 工 智 能 程序 都 是 有 
可 能 引 
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-如果 你 确实 不 需要 Clone trait 执 行 其 他 上 自 定义 操作 ( 绝 大 多 数 情况 
都 是 这 样 ) ， 编 译 器 提供 了 一 个 工具 ， 我 们 可 以 在 一 个 类 型 上 添加 # 
[derive (Clone) ]， 来 让 编译 器 帮 有 我 们 自动 生成 那些 重复 的 代码 。 编 
自动 生成 的 clone 方 法 非常 机 械 ， 就 是 依次 调用 每 个 成 员 的 clone 方 
* o 


.Rust 语 言 规定 了 在 T: Copy 的 情况 下 ，Clone trait 代 表 的 含义 。 
即 : 当 某 变量 t(;， TI 符合 T: Copy 时 ， 它 调用 t.clone () 方法 的 含义 必须 
等 同 于 “人 简单 内 存 复制 *。 也 就 是 说 ，clone 的 行为 必须 等 同 于 let 
x=std: : ptr: : read (&t) ; ， 也 等 同 于 let x=t; 。 当 T: Copy 时 ， 我 
们 不 要 在 Clone trait 里 面 乱 写 目 己 的 逻辑 。 所 以 ， 当 我 们 需要 指定 一 个 
类 型 是 Copy 的 时 候 ， 最 好 使 用 #[derive (Copy，Clone) ] 方 式 ， 避 免 手 
动 实现 Clone 导 致 错误 。 


11.6 析 构 函数 


所 谓 “ 析 构 函 数 ”(destructor) ， 是 与 “构造 函数 ”(\constructor) 相 
对 应 的 概念 。“ 构 造 函 数 " 是 对 象 被 创建 的 时 候 调 用 的 函数 ,“ 析 构 函 
数 ” 是 对 象 被 销毁 的 时 候 调 用 的 函数 。 


Rust 中 没有 统一 的 “构造 画 数 " 这 个 语法 ， 对 象 的 构造 是 直接 对 
个 成 员 进 行 匀 如 化 完成 的 ， 我 们 一 般 将 对 象 的 创建 封 疾 到 普通 静态 函 
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相对 于 构造 函数 ， 析 构 函 数 有 更 重要 的 作用 。 它 会 在 对 象 消亡 之 
前 由 编译 辟 目 动 调 用 ， 因 此 特别 适合 承担 对 象 销毁 时 释放 所 拥有 的 资 
源 的 作用 。 比 如 ，Vec 类 型 在 使 用 的 过 程 中 ， 会 根据 情况 动态 申请 内 
存 ， 当 变量 的 生命 周期 结束 时 ， 就 会 触发 该 类 型 的 析 构 函数 的 调用 。 
在 析 构 函数 中 ， 我 们 就 有 机 会 将 所 拥有 的 内 存 释 放 掉 。 在 析 构 函数 
中 ， 我 们 还 可 以 根据 需要 编写 特定 的 逻辑 ， 从 而 达到 更 多 的 目的 。 析 
构 函 数 不 仅 可 以 用 于 管理 内 存 资 源 ， 还 能 用 于 管理 更 多 的 其 他 资源 ， 
如 文件 、 锁 、socket 等 。 


在 C++ 中 ， 利 用 变量 生命 周期 绑 定 资源 的 使 用 周期 ， 已 经 是 一 种 
常用 的 编程 惯例 。 此 手法 被 称 为 RAIT (Resource Acquisition Is 
Initialization) 。 在 变量 生命 周期 开始 时 申请 资源 ， 在 变量 生命 周期 结 
束 时 利用 析 构 函数 释放 资源 ， 从 而 达到 目 动 化 管理 资源 的 作用 ， 很 大 
程度 上 减少 了 资源 的 泄露 和 旋 用 。 


在 Rust 中 编写 “ 析 构 函数 ”的 办 法 是 impl std: : ops: : Drop。Drop 
trait 的 定义 如 下 : 


trait Drop { 
fn drop(&mut self); 


Drop trait 允 许 在 对 象 即 将 消亡 之 时 ， 目 行 调用 指定 代码 。 我 们 来 
写 一 个 自 带 析 构 函数 的 类 型 。 示 例如 下 : 


use std::ops::Drop; 


struct D(i32); 
impl Drop for D 
fn drop(&mut self) { 
println!("destruct {}", self.0); 


} 

fn main() { 
let x = D(1); 
println!("construct 1"); 


{ 
let y = D(2); 
println!("construct 2"); 
println!("exit inner scope"); 


} 
println!("exit main function"); 


编译 ， 执 行 结果 为 


construct 1 
construct 2 

exit inner scope 
destruct 2 

exit main function 
destruct 1 


从 上 面 这 段 程序 可 以 看 出 析 构 函数 的 调用 时 机 。 变 量 _y 的 生存 期 
是 内 部 的 大 括号 包围 起 来 的 作用 域 (scope) ， 竺 这 个 作用 域 中 的 代码 
执行 完 之 后 ， 它 的 析 构 函数 束 被 调用 ， 变 量 _x 的 生存 期 古 整 个 main 函 
数 包 围 起 来 的 作用 域 ， 每 这 个 函数 的 最 后 一 条 语句 执行 完 之 后 ， 它 的 
析 构 函数 束 被 调用 。 


对 于 具有 多 个 局 部 变量 的 情况 ， 析 构 函 数 的 调用 顺序 是 ， 先 构造 
的 后 析 构 ， 后 构造 的 移 析 构 。 因 为 局 部 变量 存在 于 一 个 “ 栈 ” 的 结构 
中 ， 要 保持 “先进 后 出 ”的 策略 。 


11.6.1 ”资源 管理 


在 创建 变量 的 时 候 获 取 某 种 资产 ， 在 变量 生命 周期 结束 的 时 候 释 
放 资 源 ， 是 一 种 彰 见 的 设计 模式 。 这 里 的 欣 源 ， 不 仅 可 以 包括 内 存 ， 
还 可 以 包括 其 他 癌 操 作 系 统 申 请 的 资源 。 比 如 我 们 经 常用 到 的 File 类 
型 ， 会 在 创建 和 使 用 的 过 程 中 辣 操 作 系 统 申请 打开 文件 ， 在 它 的 析 构 


函数 中 就 会 去 释放 文件 。 所 以 ，RAII 手 法 是 比 GC 更 通用 的 资源 管理 手 
段 ，GC 只 能 管理 内 存 ，RAII 可 以 管理 各 种 资源 。 


下 面 用 Rust 标 准 库 中 的 “文件 ”类 型 ， 来 展示 一 下 RAII 手 法 。 示 例 


如 下 


Use std::fs::File,; 
Use std::io::Read; 
fn main() { 
let f = File::open("/target/file/path"); 
if f.is_err() 
println!("file is not exist."); 
return; 


} 
let mut f = f.unwrap(); 
Jet mut content = String::new(); 
Jet result = f,read to_ string(&mut content); 
If result.is_err() 
println!("read file error."); 
return; 


} 
println!i("{}", result.unwrap()); 


除去 那些 错误 处 理 的 代码 以 后 ， 整 个 逻辑 实际 上 相当 清晰 : 首先 
使 用 open 函 数 打 开 文 件 ， 然 后 使 用 read_to_string 方 法 读 取 内 容 ， 最 后 
关闭 文件 ， 这 里 不 需要 手动 天 闭 文 件 ， 因 为 在 File 类 型 的 析 构 函数 中 
已 经 自动 处 理 好 了 关闭 文件 这 件 事情 。 


再 比如 标准 库 中 的 各 种 复杂 数据 结构 (如 Vec LinkedList HashMap 
等 ) ， 它 们 管理 了 很 多 在 堆 上 动态 分 配 的 内 存 。 它 们 也 是 利用 “ 析 构 函 
数 ” 这 个 功能 ， 在 生命 终结 之 前 释放 了 申请 的 内 存 空 间 ， 因 此 无 须 像 C 
语言 那样 手动 调用 free 函 数 。 


11.6.2 ”主动 析 构 

一 般 情 况 下 ， 局 部 变量 的 生命 周期 是 从 它 的 声明 开始 ， 到 当前 语 
句 块 结束 。 然 而 ， 我 们 也 可 以 手动 提前 结束 它 的 生命 周期 。 请 注意 ， 
用 户主 动 调用 析 构 函数 是 非法 的 ， 示 例如 下 : 


fn main() { 
let p = Box: :new(42); 


p.drop(); 
println!("{}", p); 


编译 ， 可 见 错误 信息 : 


error[E0040]: explicit use of destructor method 
--> test.rs:5:7 


| 
5 | p.drop(); 
| AAAA explicit destructor calls not allowed 


这 说 明 编 译 絮 不 允许 手动 调用 析 构 钞 数 。 那 么 ， 我 们 怎样 才能 让 
局 部 变量 在 语句 块 结束 前 提前 终止 生命 周期 呢 ? 办 法 是 调用 标准 库 中 
的 std: : mem: : drop 了 落 数 : 


Use std::mem: :drop; 


fn main() { 


let mut v = vec![1, 2, 3]; // <--- v 的 生命 周期 开始 
drop(v); // ---> Vv 的 生命 周期 结束 
v.push(4); // 错误 的 调 


这 上 段 代码 会 编译 出 错 ， 是 因为 调用 drop 方 法 的 时 候 ，v 的 生命 周期 
束 吉 束 了 ， 后 面 继 纺 直人 使 用 变量 v 就 会 发 生 编 译 错误 。 


那么 ， : mem: : drop 函 数 是 怎样 实现 的 呢 ? 可 
7 个 函数 是 Rust 中 最 简单 的 函数 ， 因 为 它 的 实 
网 (Tm 


#[inline] 
pub fn drop<T>(_x: T) { } 


drop 了 汞 数 不 需 要 任何 的 琅 数 体 ， 只 需要 参数 为 “ 值 传递 " 即 可 。 将 
对 i 什么 都 不 用 做 ， 编 译 右 就 会 目 动 释放 掉 这 
对象 了 。 


因为 这 个 drop 函 数 的 关键 在 于 使 用 move 语 义 把 参数 传 进来 ， 使 得 
量 的 所 有 权 从 调用 方 移 动 到 drop 函 数 体 内 ， 参 数 类 型 一 定 要 是 T， 而 


不 是 &T 或 者 其 他 引用 类 型 。 函 数 体 本 喘 其 实 根本 不 重要 ， 重 要 的 是 把 
变量 的 所 有 权 move 进 入 这 个 函数 体 中 ， 画 数 调用 结束 的 时 候 该 变量 的 
生命 周期 结束 ， 变 量 的 析 构 函数 会 目 动 调用 ， 管 理 的 内 存 空 间 也 会 目 
然 释放 。 这 个 过 程 完全 符合 前 面 讲 的 生命 周期 、move 语 义 ， 无 须 编译 
颖 做 特殊 处 理 。 事 实 上 ， 我 们 完全 可 以 目 己 写 一 个 类 似 的 函数 来 实现 
同样 的 效果 ， 只 要 保证 参数 传递 是 move 语 义 即 可 。 


因此 ， 对 于 Copy 类 型 的 变量 ， 对 它 调 用 std: : mem: : drop 函 数 
征 没有 意义 的 。 下 面 以 整数 类 型 作为 示例 来 说 明 : 


use std::mem::drop; 


fn main() { 
let x = 1 i32; 
println!("before drop {}", x); 
drop(x); 
println!("after drop {}", x); 


这 种 情况 很 容易 理解 。 因 为 Copy 类 型 在 函数 参数 传递 的 时 候 执 行 
的 是 复制 语义 ， 原 来 的 那个 变量 依然 存在 ， 传 入 函数 中 的 只 是 一 个 复 
制品 ， 因 此 原 变量 的 生命 周期 不 会 受到 影响 。 


变量 遮蔽 (Shadowing) 不 会 导致 变量 生命 周期 提前 结束 ， 它 不 等 
同 于 drop。 示 例如 下 : 


use std::ops::Drop; 
struct D(i32); 


impl Drop for D { 
fn drop(&mut self) { 
println!("destructor for {}", self.0); 


} 


fn main() { 
let x = D(1); 
println!("construct first variable"); 
let x = D(2); 
println!("construct second variable"); 


编译 ， 执 行 ， 输 出 的 结 采 为 : 


construct first variable 
construct second variable 
destructor for 2 
destructor for 1 


这 里 函数 调用 的 顺序 为 ， 先 创建 第 一 个 x， 再 创建 第 二 个 x， 姐 出 
函数 的 时 候 ， 移 析 构 第 二 个 x， 再 析 构 第 一 个 x。 由 此 可 见 ， 在 第 二 个 x 
出 现 的 时 候 ， 唱 然 将 第 一 个 x 遮蔽 起 来 了 ， 但 十 第 一 个 x 的 生命 周期 并 
未 结束 ， 它 依然 存在 ， 直 到 函数 退出 。 这 也 说 明了 ， 虽 然 这 两 个 变量 
宕 是 了 同一 个 名 字 ， 但 在 编 详 带 内 部 依然 将 它们 视 为 两 个 不 同 的 变 
量 。 


男 外 还 有 一 个 小 问题 需要 提醒 读者 注意 ， 那 就是 下 划 线 这 个 特殊 
符号 。 请 注意 : 如 果 你 用 下 划 线 来 绑 定 一 个 变量 ， 那 么 这 个 变量 会 当 
场 执行 析 构 ， 而 不 是 等 到 当前 语句 块 结束 的 时 候 再 执行 。 下 划 线 是 特 
殊 符号 ， 不 十 普 通 标识 符 。 示 例如 下 : 


use std::ops::Drop; 
struct D(i32); 
impl Drop for D { 


fn drop(&mut self) 区 
println!("destructor for {}", self.0); 


} 


fn main() { 
let x = D(1); 
let _ = D(2); 


let y = D(3); 


执行 结果 为 : 


destructor for 2 
destructor for 3 
destructor for 1 


之 所 以 是 这 样 的 结果 ， 是 因为 用 下 划 线 绑 定 的 那个 变量 当场 殴 执 
行 了 析 构 ， 而 其 他 两 个 变量 等 到 语句 块 结束 了 才 执行 析 构 ， 而 且 析 构 
顺序 和 初始 化 顺序 刚好 相反 。 所 以 ， 如 果 大 家 需要 利用 RAT 实现 某 个 


变量 的 析 构 函数 在 退出 作用 域 的 时 候 完 成 某 些 功能 ， 于 万 不 要 用 下 划 
线 来 绑 定 这 个 变量 。 


最 后 ， 请 大 家 注意 区 分 ，std: : mem: : drop () 函数 和 std: : 
ops: : Drop: : drop () 方法 。 


1) std: : mem: : drop () 函数 是 一 个 独立 的 函数 ， 不 是 某 个 类 
型 的 成 员 方 法 ， 它 由 程序 员 主 动 调用 ， 作 用 是 使 变量 的 生命 周期 提前 
结束 ;std: : ops: : Drop: : drop () 方法 是 一 个 trait 中 定义 的 方 
ER 编译 器 会 日 动 调用 ， 手 动 调用 是 
、 Ll | 2 


2) std: : mem: : drop<T> (_x: T) 的 参数 类 型 是 T， 采 用 的 是 
move 语 义 ; std: : ops: : Drop: : drop (&mnut self) 的 参数 类 型 是 
&mut Self， 采 用 的 是 可 变 借 用 。 在 析 构 函数 调用 过 程 中 ， 我 们 还 有 机 
会 读 取 或 者 修改 此 对 象 的 属性 。 


11.6.3 Drop VS.Copy 


前 面 已 经 讲 了 ， 要 想 实 现 Copy trait， 类 型 必须 满足 一 定 条 件 。 这 
个 条 件 束 是 : 如 果 一 个 类 型 可 以 使 用 memcpy 的 方式 执行 复制 操作 ， 且 
没有 内 存 安全 问题 ， 那 么 它 才 能 被 允许 实现 Copy trait。 反 过 来 ， 所 有 
满足 Copy trait 的 类 型 ， 在 需要 执行 move 语 义 的 时 候 ， 使 用 memcpy 复 

制 一 份 副 本 ， 不 删除 原件 是 完全 不 会 产生 安全 问题 的 。 


本 节 中 需要 强调 的 是 ， 带 有 析 构 画 数 的 类 型 都 是 不 能 满足 Copy 语 
义 的 。 因 为 我 们 不 能 保证 ， 对 于 带 析 构 画 数 的 类 型 ， 使 用 memcpy 复 抽 
一 太一 本 一 定 不 会 有 内 存 安全 问题 。 所 以 对 于 这 种 情况 ， 编 府 嘎 是 直 
这 禁止 的 。 


同样 ， 下 面 还 是 用 示例 来 说 明 : 


use std::ops::Drop; 
struct T; 


impl Drop for T { 
fn drop(&mut self){} 


impl Copy for T 全 


fn main() 人 


编译 ， 可 见 编 译 错误 : 


error[E0184]: the trait ‘Copy may not be implemented for this type; the type has 
a destructor 
--> test.rs:9:1 
| 
9 | impl Copy for T {} 
| AAAAAAAAAAAAAAAAAA Copy not allowed on types with destructors 


错误 信息 说 得 清 清 楚楚 ， 带 有 析 构 函数 的 类 型 不 能 是 Copy。 这 两 
个 身份 是 不 能 同时 存在 于 一 个 类 型 上 的 。 


11.6.4， 析 构 标记 


在 Rust 里 面 ， 析 构 函 数 是 在 变量 生命 周期 结束 的 时 候 被 调用 的 。 
然而 ， 既 然 我 们 可 以 手动 提前 终止 变量 的 生命 周期 ， 那 么 就 说 明 ， 变 
量 的 生命 周期 并 不 是 简单 地 与 某 个 代码 块 一 致 ， 生 命 周 期 何 时 结束 ， 
很 可 能 是 由 运行 时 的 条 件 决定 的 。 下 面 用 一 个 示例 来 说 明 变 量 的 析 构 
函数 调用 时 机 是 有 可 能 在 运行 阶段 发 生 改变 的 : 


use std::ops::Drop; 
Use std::mem: :drop; 


Struct D(&'static str); 
impl Drop for D { 
fn drop(&mut self) { 
println!("destructor {}", self.0); 


} 
// 获取 DROP 环境 变量 的 值 , 并 转换 为 整数 


fn condition() -> Option<u32> { 
std: :env::var("DROP") 
.map(|s| s.parse::<u32>().unwrap_or(0)) 
.Ok() 


} 


fn main() { 
let var = (D("first"), D("second"), D("third")); 
match condition() { 
Some(1) => drop(var.0), 
Some(2) => drop(var.1), 
Some(3) => drop(var.2), 


= 


println!("main end"),; 


在 上 面 这 段 示例 代码 中 ， 我 们 在 变量 的 析 构 函数 中 写 了 一 条 打印 
语句 ， 用 于 判断 析 构 函数 的 调用 顺序 。 在 主 函 数 里 面 ， 则 通过 判断 当 
前 的 环境 变量 信息 来 决定 是 否 拓 前 终止 某 个 变量 的 生命 周期 。 


编译 执行 ， 如 果 我 们 没有 设置 DROP 环 境 变 量 ， 输 出 结果 为 : 


main end 
destructor first 
destructor second 
destructor third 


如 果 我 们 设置 了 export DROP=2 这 个 环境 变量 ， 不 重新 编译 ， 执 
行 同 样 的 代码 ， 输 出 结果 为 : 


destructor second 
main end 
destructor first 
destructor third 


我 们 还 可 以 将 DROP 环 境 变 量 的 值 分 别 改 为 “1”、“2”、“3”， 结 末 
会 导致 析 构 函数 的 调用 顺序 发 生变 化 。 


然而 ， 问 题 来 了 ， 前 面 说 过 ， 析 构 画 数 的 调用 古 在 编译 阶段 束 确 
定好 了 的 ， 调 用 析 构 函数 是 编译 器 目 动 插 入 的 代码 做 的 。 而 且 示 例 叉 
表明 ， 析 构 函 数 的 具体 调用 时 机 还 是 跟 运 行 时 的 情况 相关 的 。 那 么 编 
译 絮 是 怎么 做 到 的 呢 ? 


编译 器 是 这 样 完 成 这 个 功能 的 ， 首 先 判 断 一 个 变量 是 否 可 能 会 在 
多 个 不 同 的 路 径 上 发 生 析 构 ， 如 果 是 这 样 ， 那 么 它 会 在 当前 函数 调用 
栈 中 目 动 插入 一 个 bool 类 型 的 标记 ， 用 于 标记 该 对 象 的 析 构 函数 是 否 
己 经 被 调用 ， 生 成 的 代码 逻辑 像 下 面 这 样 : 


// 以 下 为 伪 代 码 , 仅仅 是 示意 
fn main() { 
let var = (D("first"), D("second"), D("third")); 


// 当 函 数 中 有 拥有 所 有 权 的 对 象 时 ,需要 有 析 构 自动 标记 
let drop_flag 0 = false; // --- 
let drop_flag 1 = false; // --- 
let drop_flag 2 = false; // --- 


// 退出 语句 块 时 , 对 当前 block 内 拥有 所 有 权 的 对 象 调用 析 构 函数 , 并 设置 标记 
match condition() { 
Some(1) => { 
drop(var.0); 
If (!drop_flag 0) { // --- 
drop_flag 0 = true; // --- 
} // --- 
} 
Some(2) => { 
drop(var.1); 
If (!drop_ flag_ 1) { // --- 
drop_flag_1 = true; // --- 
// - 
} 
Some(3) => { 
drop(var .2); 
If (!drop_flag 2) { // --- 
drop_flag_ 2 = true; // --- 
} // --- 
} 
-=> {}, 
println!("main end"); 
设置 标记 


// 退出 语句 块 时 , 对 当前 block 内 拥有 所 有 权 的 对 象 调用 析 构 函数 ， 
If (!drop_flag 0) { // --- 


drop(var.0); // --- 
drop_flag 0 = true; // --- 
} // --- 
If (!drop_ flag_ 1) { // --- 
drop(var.1); // --- 
drop_flag_ 1 = true; // --- 
} // --- 
If (!drop_flag 2) { // --- 
drop(var .2); // --- 
drop_flag 2 = true; // --- 
} // --- 


} 


编译 和 右 生 成 的 代码 类 似 于 上 面 的 示例 ， 可 能 会 有 细微 差别 。 原 理 
征 在 析 构 函数 被 调用 的 时 候 ， 束 把 标记 设置 一 个 状态 ， 在 各 个 可 能 调 
用 析 构 函数 的 地 方 都 先 判 断 一 下 状态 再 调用 析 构 函数 。 这 样 ， 编 译 阶 
段 确 定 生命 周期 和 执行 阶段 根据 情况 调用 束 统 一 起 来 了 。 


第 12 章 ”借用 和 生命 周期 
12.1 生命 周期 


一 个 变量 的 生命 周期 束 是 它 从 创建 到 销 哎 的 整个 过 程 。 其 实 我 们 
在 前 面 已 经 注意 到 了 这 样 的 现象 : 


fn main() { 


let v = vec![1,2,3,4,5]; // --> v 的 生命 周期 开始 
{ 
let center = v[2]; // --> center 的 生命 周期 开始 
println!("{}", center); 
// <-- center 的 生命 周期 结束 


} 
println!("{:?}", VvV); 


// <-- Vv 的 生命 周期 结束 


然而 ， 如 采 一 个 变量 永远 只 能 有 唯一 一 个 入 口 可 以 访问 的 话 ， 那 
忠 太 难 使 用 了 。 因 此 ， 所 有 权 还 可 以 借用 。 


12.2 ”借用 


变量 对 其 管理 的 内 存 拥有 所 有 权 。 这 个 所 有 权 不 仅 可 以 被 转移 
， 还 可 以 被 借用 (borrow) 。 本 节 讲解 一 下 如 何 实现 所 有 权 
此 用 。 


普 用 指针 的 语法 使 用 & 符 号 或 者 &mut 符 号 表示 。 前 者 表示 只 读 借 
用 ， 后 者 表示 可 读 写 借用 。 借 用 指针 (borrow pointer) 也 可 以 称 作 * 引 
用 ” (reference) 。 借 用 指针 与 普通 指针 的 内 部 数据 是 一 模 一 样 的 ， 唯 
一 的 区 别 是 语义 层面 上 的 。 它 的 作用 是 告诉 编译 右 ， 它 对 指 同 的 这 块 
内 存 区 域 没 有 所 有 权 。 


示例 如 下 : 


fn foo(v: &Vec<i32>) { 
v.push(5); 


fn main() { 
let v = vec![]; 
foo(&v); 

} 


这 里 会 出 现 编译 错误 ， 信 息 为 “cannot borrow immutable borrowed 
content *y as mutable” ° 


二 原 轩 在 于 Vec ， Push 夯 数 * 它 的 作用 是 对 动态 数组 添加 元 素 ， 它 


pub fn push(&mut self, value: T) 


它 要 求 self 参 数 是 一 个 &mnut Self 类 型 。 而 我 们 给 foo 传 递 的 参数 是 
&Vec 类 型 ， 因 此 会 报错 。 修 复方 式 如 下 : 


// 我 们 需要 “可 变 的 “借用 指针 , 因此 画 数 签名 需要 改变 
fn foo(v: &mut Vec<i32>) { 
v.push(5); 


fn main() { 
// 我 们 需要 这 个 动态 数组 本 身 是 “可 变 的 ”, 才能 获得 它 的 “可 变 借用 指针 ” 


let mut v = vec![]; 


// 在 函数 调用 的 时 候 , 同时 也 要 显示 获取 它 的 “可 变 借 用 指针 ” 
foo(&mut v); 


// 打印 结果 , 可 以 看 到 Vv 已 经 被 改变 
printin!("{: 2}", VvV); 


对 于 &mnut 型 指针 ， 请 大 家 注意 不 要 混 消 它 与 变量 绑 定 之 间 的 语 
法 。 如 有 果 mnut 修 岳 的 是 变量 名 ， 那 么 它 代 表 这 个 变量 可 以 被 重新 绑 
定 ; 如 果 mut 修 饰 的 是 “借用 指针 &”， 那 么 它 代 表 的 是 被 指向 的 对 象 可 
以 被 修改 。 示 例如 下 : 


fn main() { 
let mut var = 0_i32; 


let p1 = &mut var; // pl 指针 本 身 不 能 被 重新 绑 定 ,我们 可 以 通过 p1 改 变 变 量 var 的 值 


*p1 = 1; 


rc 


let temp = 2_i32; 
let mut p2 = &var; // 我 们 不 能 通过 p2 改 变 变量 var 的 值 , 但 p2 指 针 本 身 指向 的 位 置 可 以 被 改 


六 


p2 = &temp; 


rc 


let mut temp = 3_132 

let mut p3 = &mut var; // 我 们 既 可 以 通过 p3 改 变 变量 var 的 值 , 而 且 p3 指 针 本 身 指向 的 位 
也 可 以 改变 

“p3 = 3; 

p3 = &mut temp; 


} 
} 


昔 用 指针 在 编译 后 ， 实 际 上 束 古 一 个 普通 的 指针 ， 它 的 意义 只 能 
在 编译 阶段 的 静 仿 检查 中 体现 。 


12.3 ”借用 规则 


天 于 借用 指针 ， 有 以 下 几 个 规则 : 
“借用 指针 不 能 比 它 指向 的 变量 存在 的 时 间 更 长 。 


-gmut 型 借用 只 能 指向 本 身 具 有 mut 修 饰 的 变量 ， 对 于 只 读 变量 ， 
不 可 以 有 &mut 型 借用 。 


-&mut 型 借用 指针 存在 的 时 候 ， 被 借用 的 变量 本 身 会 处 于 “冻结 ” 状 


太 。 


如果 只 有 & 型 借用 指针 ， 那 么 能 同时 存在 多 个 ， 如 果 存 在 &mut 型 
昔 用 指针 ， 那 么 只 能 存在 一 个 ;如 采 同 时 有 其 他 的 & 或 者 &mut 型 借用 
利 针 存在 ， 那 么 会 出 现 编译 错误 。 


昔 用 指针 只 能 临时 地 拥有 对 这 个 变量 读 或 写 的 权限 ， 没 有 义务 管 
理 这 个 变量 的 生命 周期 。 因 此 ， 借 用 指针 的 生命 周期 绝对 不 能 大 于 它 
所 引用 的 原来 变量 的 生命 周期 ， 否 则 就 是 葵 空 指针 ， 会 导致 内 存 不 安 
全 。 示 例如 下 : 


// 这 里 的 参数 采用 的 “引用 传递 ”， 意味 着 实 参 本 身 并 未 丢失 对 内 存 的 管理 权 
t 


fn borrow_semantics(v : &Vec<i32>) 


// 打印 参数 占用 空间 的 大 小 , 在 64 位 系统 上 , 结果 为 8, 表明 该 指针 与 普通 裸 指针 的 内 部 表示 方法 相同 
println!("size of param: {}", std::mem::size of::<&Vec<i32>>()); 
for item in v { 

print!("{} ", item); 


} 
println!(""); 


// 这 里 的 参数 采用 的 “ 值 传 递 ”, 而 Vec 没 有 实现 Ccopy trait, 意味 着 它 将 执行 nove 语 义 
fn move_semantics(v : Vec<i32>) { 


// 打印 参数 占用 空间 的 大 小 , 结果 为 24, 表明 实 参 中 栈 上 分 配 的 内 存 空间 复 制 到 了 画 数 的 形 参 中 
println!("size of param: {}", std::mem::size_of::<Vec<i32>>()); 
for item in v { 

print!("{} ", item); 


} 
println!(""); 


fn main() { 
let array = vec![1, 2, 3]; 


// 需要 注意 的 是 , 如 果 使 用 引用 传递 , 不 仅 在 函数 声明 的 地 方 需要 使 用 & 标 记 
// 画 数 调用 的 地 方 同样 需要 使 8 标记 ， 否则 会 出 现 语 法 错误 
// 这 样 设计 主要 是 为 了 显眼 ,不 去 阅读 该 丽 数 的 签名 就 知道 这 个 画 数 席 的 时 候 发 生 了 什么 
// 而 小 数 点 方式 的 成 员 画 数 调 ,对 于 self 参 数 , 会 “自动 转换 ”不 必 显 式 借用 ,这 里 有 个 区 别 
borrow_ semantics(&array); 


// 在 使 用 引用 传递 给 上 面 的 函数 后 , array 本 身 依 然 有 将, 我们 还 能 在 下 面 的 函数 中 使 


move_semantics(array); 


// 在 使 用 move 语 义 传递 后 , array 在 这 个 函数 调用 后 , 它 的 生命 周期 已 经 完结 


在 这 里 给 大 家 提 个 醒 : 一 般 情 况 下 ， 男 数 参数 使 用 引用 传递 的 时 
候 ， 不 仅 在 函数 声明 这 里 要 写 上 类 型 参数 ， 在 函数 调用 这 里 也 要 显 式 
地 使 用 引用 运算 符 。 但 是 ， 有 一 个 例外 ， 那 束 是 当 参 数 为 self &self 
&mut self 等 时 ， 者 使 用 小 数 点 语法 调用 成 员 方法 ， 在 画 数 调用 这 里 不 
能 显 式 写 出 借用 运算 符 。 以 常见 的 String 类 型 来 举例 : 


fn main() { 
// 创建 了 一 个 可 变 的 String 类 型 实例 
let mut x : String = "hello".into(); 


// 调用 len(&self) -> usize 函数 。 self 的 类 型 是 &Self 
// Xx.len() 等 同 于 String::len(&x) 
println!("length of String {}", x.len()); 


// 调用 fn push(&mut self，ch: char) 函数 。self 的 类 型 是 &mut Self, 因此 它 有 权 对 字符 串 
做 修改 

// Xx.push('!') 等 同 于 String::push(&mut x,，'!') 

x.push('!'); 


println!("length of String {}", x.len()); 


// 调用 fn into_bytes(self) -> Vec<u8> 画 数 。 注 意 selLf 的 类 型 , 此 处 发 生 了 所 有 权 转 移 
// x,into_bytes() 等 同 于 String::into_bytes(x) 
let v = x.into_bytes(); 


// 再 次 调用 len( ), 编译 失败 , 因为 此 处 已 经 超过 了 x 的 生命 周期 
//printlin!("length of String {}", x.len()); 


} 


在 这 个 示例 中 ， 所 有 的 函数 调用 都 是 同样 的 语法 ， 比 如 x.len 
() ~ x.push ('! ) 、x.into_bytes () 等 ， 但 它们 背后 对 self 参 数 的 传 
递 类 型 完 全 小 间 ， 因此 也 就 量 现 了 不 同 的 语义 。 这 是 需要 提醒 大 家 注 
意 的 地 方 。 当 然 ， 如 有 果 我 们 使 用 统一 的 完整 贸 数 调用 语法 ， 那 么 所 有 
的 参数 传递 类 型 在 调用 端 都 是 显 式 写 出 来 的 。 


任何 借用 指针 的 存在 ， 都 会 导致 原来 的 变量 被 “ 冻 
结 ”(Frozen) 。 示 例如 下 : 


fn main() { 
let mut x = 1 i32; 
let p = &mut x; 
x = 2; 
println!("value of pointed : {}", p); 


编译 结果 为 : 


error: cannot assign to ‘x because it is borrowed 


因为 p 的 存在 ， 此 时 对 x 的 改变 被 认为 是 非法 的 。 至 于 为 什么 会 有 
这 样 的 规定 ， 请 参考 下 一 章 。 


12.4 生命 周期 标记 


对 一 个 函 数 内 部 的 生命 周期 进行 分 析 ，Rust 编 译 器 可 以 很 好 地 解 
0 
I 


12.4.1 画 数 的 生命 周期 标记 


示例 如 下 : 
01| Struct T { 
02 | member: i32, 
03| } 
04| 
05| fn test<'a>(arg: &'a T) -> &'a i32 
06| { 
07 | &arg.member 
08| } 
09| 
10| fn main() { 
11 | let t =T { member : 0 }; //----- 't -| 
12| let x = test(&t); //-- 'x ---| | 
13| println!i("{:?}", x); // | | 
14| //-- 'X ----- “起 全 


生命 周期 符号 使 用 单 引 号 开头 ， 后 面 跟 一 个 合法 的 名 字 。 生 命 周 
期 标记 和 泛 型 类 型 参数 是 一 样 的 ， 都 需要 移 声 明 后 使 用 。 在 上 面 这 段 
代码 中 ， 尖 括号 里 面 的 'a 是 声明 一 个 生命 周期 参数 ， 它 在 后 面 的 参数 
和 返回 值 中 被 使 用 。 


前 面 提 到 的 借用 指针 类 型 都 有 一 个 生命 周期 泛 型 参数 ， 它 们 的 完 
整 写法 应 该 是 &'a T&'a mut T， 只 不 过 在 做 局 部 变量 的 时 候 ， 生 命 周 期 
参数 是 可 以 省 略 的 。 


生命 周期 之 间 有 重要 的 包含 关系 。 如 果 生 命 周 期 'a 比 b 更 长 或 相 
等 ， 则 记 为 'a: 中 ， 意 思 是 'a 至 少 不 会 比 b 短 ， 现 语 读 做 “lifetime a 
outlives lifetime b”。 对 于 借用 指针 类 型 来 说 ， 如 果 &'a 是 合法 的 ， 那 
么 b 作 为 'a 的 一 部 分 ，&mb 也 一 定 是 合法 的 。 


另外 ，'static 是 一 个 特殊 的 生命 周期 ， 它 代表 的 是 这 个 程序 从 开始 
到 结束 的 整个 阶段 ， 所 以 它 比 其 他 任何 生命 周期 都 长 。 这 意味 着 ， 任 
意 一 个 生命 周期 'a 都 满足 'static: 'a。 


在 上 面 这 个 例子 中 ， 如 果 我 们 把 变量 t 的 真实 生命 周期 记 为 4， 那 
入 这 个 生命 周期 实际 上 是 变量 t 从 “出 生 ” 到 “死亡 ”的 区 间 ， 即 从 第 11 行 
到 第 14 行 。 在 函数 被 调用 的 时 候 ， 它 传 入 的 实际 参数 是 &t， 它 是 指 癌 { 
的 引用 。 那 么 可 以 说 ， 在 调用 的 时 候 ， 这 个 泛 型 参数 'a 被 实例 化 为 
了 T't。 根 据 函 数 签 名 ， 基 于 返回 类 型 的 生命 周期 与 参数 是 一 致 的 ， 可 以 
推理 出 test 函 数 的 返回 类 型 是 &'ti32。 如 果 我 们 把 x 的 生命 周期 记 为 x， 
那么 x 代表 的 就 是 从 第 12 行 到 第 14 行 。 这 条 ]et x=text (&t) ; 语句 实 
际 上 是 把 &'t i32 类 型 的 变量 赋值 给 &'x i32 类 型 的 变量 。 这 个 赋值 是 否 
合理 呢 ? 它 应 该 是 合理 的 。 因 为 这 两 个 生命 周期 的 关系 是 t: x。test 返 
回 的 那个 指针 在 't 这 个 生命 周期 范围 内 都 是 合法 的 ， 在 一 个 被 包围 的 
更 小 范围 的 生命 周期 内 ， 它 当然 也 是 合法 的 。 所 以 ， 上 面 这 个 例子 可 


接 下 来 ， 我 们 把 上 面 这 个 例子 稍 作 修改 ， 让 test 函 数 有 了 两 个 生命 周 
期 参数 ， 其 中 一 个 给 函数 参数 使 用 ， 男 外 一 个 给 返回 值 使 用 : 


fn test<'a, 'b>(arg: &'a T) -> &'b i32 


&arg.member 


编译 时 果然 出 了 问题 ， 在 &arg.member 这 一 行 ， 报 了 生命 周期 错 
误 。 这 是 为 什么 呢 ? 因为 这 一 行 代 码 是 把 &'a i32 类 型 赋值 给 &'b i32 类 
型 。'a 和 Tb 有 什么 关系 ? 答案 是 什么 关系 都 没有 。 所 以 编译 人 句 觉 得 这 个 
赋值 是 错误 的 。 怎 么 修复 呢 ? 指定 'a: 就 可 以 了 。'a 比 'b“ 活 ”得 长 ， 目 
然 ，&'a i32 类 型 赋值 给 &'b i32 类 型 是 没 问题 的 。 验 证 如 下 : 


fn test<'a, 'b>(arg: &'a T) -> &'b i32 
where 'a:'b 


{ 


&arg.member 


经 过 这 样 的 改写 后 ， 我 们 可 以 认为 ， 在 test 函 数 被 调用 的 时 候 ， 生 
命 周 期 参数 a 和 "被 分 别 实例 化 为 了 t 和 'x。 它 们 刚好 满足 了 where 条 件 


中 的 tt 约束 。 而 &arg.member 这 条 表达 式 的 类 型 是 &'ti32， 返 回 值 要 
求 的 是 &'x i32 类 型 ， 可 见 这 也 是 合法 的 。 所 以 test 芳 数 的 生命 周期 检查 
可 以 通过 

上 述 示 例 是 读者 比较 难 理解 的 地 方 。 以 下 两 种 写法 都 是 可 行 的 : 


fn test<'a>(arg: &'a T) -> &'a 1i32 
fn test<'a, 'b>(arg: &'a T) -> &'b i32 where 'a:'b 


这 里 的 关键 是 ，Rust 的 引用 类 型 是 支持 “ 协 变 ”的 。 在 编译 右 服 
里 ， 生 命 周 期 就 古 一 个 区 间 ， 生 命 周 期 参数 就 古 一 个 普通 的 沁 型 参 
数 ， 它 可 以 被 特 化 为 某 个 具体 的 生命 周期 。 


我 们 再 看 一 个 例子 。 它 有 两 个 引用 参数 ， 共 至 同一 个 生命 周期 标 


fn Select<'a>(arg1: &'a i32, arg2: &'a i32) -> &'a i32 { 
If *arg1 > *arg2 { 
arg1 
} else { 
arg2 


} 


fn main() { 
let x = 1; 
let y = 2; 
let selected = select(&x, &y); 
println!("{}", selected); 


上 述 示例 中 ，select 这 个 函数 引入 了 一 个 生命 周期 标记 ， 两 个 参数 
以 及 返回 值 都 是 用 的 这 个 生命 周期 标记 。 同 时 我 们 注意 到 ， 在 调用 的 
时 候 ， 传 递 的 实 参 其 实 是 具备 不 同 的 生命 周期 的 。x 的 生命 周期 明显 大 
于 y 的 生命 周期 ， &x 可 和 存活 的 范围 要 大 于 &y 可 行 活 的 范围 ， 我 们 把 它 
们 的 实际 生命 周期 分 别 记录 为 x 和 'y。select 芳 数 的 形式 参数 要 求 的 是 
同样 的 生命 周期 ， 而 实际 参数 是 两 个 不 同 生命 周期 的 引用 ， 这 个 类 型 
之 所 以 可 以 匹配 成 功 ， 就 是 因为 生命 周期 的 协 变 特性 。 编 译 器 可 以 把 
ee | 某 个 生命 周期 'a 以 内 ， 且 满 
足 xX: 'a，'y: 'a。 返 回 的 selected 变 量具 备 'a 生 命 导 全 也 并 没有 超过 
和 vy 的 范围 。 有. 最 终 的 生命 周期 检查 可 以 通 


12.4.2 ”类 型 的 生命 周期 标记 


如 采 目 定义 类 型 中 有 成 员 包 仿生 命 周 期 参数 ， 那 么 这 个 目 定义 类 
型 也 必须 有 生命 周期 参数 。 示 例如 下 : 


Struct Test<'a> { 
member: &'a str 


} 


在 使 用 impl 的 时 候 ， 也 需要 先 声 明 再 使用: 


impl<'t> Test<'t> { 
fn test<'a>(&self, s: &'a str) { 


} 
} 

impl 后 面 的 那个 是 用 于 声明 生命 周期 参数 的 ， 后 面 的 Test< 心 是 在 
7 °。 如果 有 必要 的 话 ， 方 法 中 还 能 继续 引入 新 的 泛 

如 果 在 泛 型 约束 中 有 where T: 'a 之 类 的 条 件 ， 其 意思 是 ， 类 型 T 
的 所 有 生命 周期 参数 必须 大 于 等 于 'a。 要 特别 说 明 的 是 ， 若 是 有 where 
T: 'static 的 约束 ， 意 思 则 是 ， 类 型 T 里 面 不 包含 任何 指 疝 短 生 命 周 期 的 
普 用 指针 ， 意 思 是 要 么 完全 不 包含 任何 人 借用， 要么 可 以 有 指 问 'static 的 


昔 用 指针 。 


12.5 ”省略 生 命 周期 标记 


在 某 些 情况 下 ，Rust 允 许 我 们 在 写 画 数 的 时 候 省 略 掉 显 式 生命 周 
期 标记 。 在 这 种 时 候 ， 编 译 右 会 通过 一 定 的 固定 规则 为 参数 和 返回 值 
指定 合适 的 生命 周期 ， 从 而 省 略 一 些 显而易见 的 生命 周期 标记 。 比 如 
我 们 可 以 写 这 样 的 代码 : 


fn get_str(s: &String) -> &str { 
s.as_ref() 


} 


实际 上 ， 它 等 同 于 下 面 这 样 的 代码 ， 只 是 把 显 式 的 生命 周期 标记 
省 略 控 了 而 已 : 


fn get_str<'a>(s: &'a String) -> &'a str { 
s.as_ref() 


者 把 以 上 代码 稍微 修改 一 下 ， 返 回 的 指针 将 并 不 指 癌 参数 传 和 的 
数据 ， 而 是 指 癌 一 个 静态 和 常量， 代码 如 下 : 


fn get_str(s: &String) -> &str { 
println!( 'call fn {}", Ss); 
"hello world" 
} 


这 时 ， 我 们 期 望 返回 的 指针 实际 上 古 &'static str 类 型 。 测 试 代码 如 


fn main() { 
let c = String: :Trom( "haha") ， 
Jet x: &'static str = get_str(&c); 
println!("{}", x); 


针 。 在 主 而 数 的 调 中 区 ne re 


一 次 ， 我 们 发 现 了 编译 错误 : 


error: ‘c. does not live long enough 


按照 分 析 ， 变 量 x 理 应 指 癌 一 个 'static 生 命 周 期 的 变量 ， 根 本 不 是 
指 癌 C 变 量 ， 它 的 存活 时 间 足 够 长 ， 为 什么 编译 器 没 发 现 这 一 点 呢 ? 
这 是 因为 ， 编 译 絮 对 于 省 略 挥 的 生命 周期 ， 不 是 用 的 “上 自动 推理 ” 策 
上 略 ， 而 是 用 的 几 个 非常 简单 的 “固定 规则 * 策 略 。 这 跟 类 型 自动 推导 不 
一 样 ， 当 我 们 省 略 变量 的 类 型 时 ， 编 译 恬 会 试图 通过 变量 的 使 用 方式 
推导 出 变量 的 类 型 ， 这 个 过 程 叫 *type inference”。 而 对 于 省 略 掉 的 生 
命 周 期 参数 ， 编 译 器 的 处 理 方式 就 简 单 粗 暴 得 多 ， 它 完全 不 管 画 数 内 
部 的 实现 ， 并 不 尝试 找到 最 合适 的 推理 方案 ， 只 是 应 用 几 个 固定 的 规 
则 而 已 ， 这 些 规 则 被 称 为 “lifetime elision rules”。 以 下 就 是 省 略 的 生命 
周期 被 自动 补 全 的 规则 : 


:每 个 市 生命 周期 参数 的 输入 参数 ， 每 个 对 应 不 同 的 生命 周期 参 


“如 采 只 有 一 个 输入 参数 市 生命 周期 参数 ， 那 么 返回 值 的 生命 周期 
被 指定 为 这 个 参数 ; 


如 采 有 多 个 输入 参数 市 生命 周期 参数 ， 但 其 中 有 &self、&mnut 
self， 那 么 返回 值 的 生命 周期 被 指定 为 这 个 参数 ; 


-以 上 都 不 满足 ， 束 不 能 目 动 补 全 返回 值 的 生命 周期 参数 。 
这 时 再 回头 去 看 前 面 的 例子 ， 可 以 知道 ， 对 于 这 个 函数 : 


fn get_str(s: &String) -> &str { 
println!("call fn {}", s); 
"hello world" 


编译 器 会 目 动 补 全 生命 周期 参数 : 


fn get_str<'a>(s: &'a String) -> &'a str { 
println!("call fn {}", s); 


"hello world" 


所 以 ， 当 我 们 调用 


let x: &'static str = get_str(&c); 


这 名 代码 的 时 候 ， 融 发 生 了 编译 错误 。 了 解 了 这 些 ， 修 复方 案 也 
台 很 简单 了 。 在 这 种 情况 下 ， 我 们 不 能 省 略 生命 周 期 参数 ， 让 编译 天 
给 我 们 目 动 补 全 ， 目 己 手 写 束 对 了 : 


fn get_str<'a>(s: &'a String) -> &'static str { 
println!("call fn {}", s); 
"hello world" 

} 


或 者 只 手写 返回 值 的 生命 周期 参数 ， 输 入 参数 徘 编 译 絮 目 动 补 


全 : 


fn get_str(s: &String) -> &'static str { ... } 


最 后 ， 一 句 话 总 结 ， elision ! =inference， 省 略 生 命 周期 参数 和 类 
型 自动 推导 的 原理 是 完全 不 同 的 。 


第 13 间 ”借用 检查 


在 前 文中 ， 我 们 已 经 讨论 了 Rust 在 内 存 管 理 方面 的 语法 。 本 文 将 
主要 探讨 Rust 实 现 无 性 能 损失 的 “内 存 安全 ”的 原理 。 


Rust 语 言 的 核心 特点 是 : 在 没有 放弃 对 内 存 的 直接 控制 力 的 情况 
下 ， 实 现 了 内 存 安全 。 所 请 对 内 存 的 直接 控制 能 力 ， 前 文 已 经 有 所 展 
示 : 可 以 目 行 决定 内 存 布局 ， 包 括 在 栈 上 分 配 内 存 ， 还 是 在 堆 上 分 配 
内 存 ; 文 持 指针 类 型 ， 可 以 对 一 个 变量 实施 取 地 址 操作 ;有 确定 性 的 


另 一 方面 ， 从 安全 性 的 角度 来 说 ， 我 们 可 以 看 到 ，Rust 有 所 有 权 
概念 、 借 用 指针 、 生 命 周 期 分 析 等 这 些 内 容 。 初 学 者 在 刚 开始 碰 到 这 
些 概念 的 时 候 ， 往 往 会 觉得 无 所 运 从 ， 感 觉 太 麻 烦 、 太 复杂 了 。 随 便 
写 个 小 程序 都 编译 不 通过 ， 学 习 曲 线 非常 陡峭 。 那 么 ，Rust 设 计 者 守 
竞 旦 如 何 考 虑 的 这 个 问题 ， 为 什么 要 设计 这 样 复杂 的 规则 ? Rust 语 言 
的 这 一 系列 安全 规则 ， 背 后 的 指导 思想 究 竞 是 什么 呢 ? 


总 的 来 说 ，Rust 的 设计 者 们 在 一 系列 的 “内 存 不 安全 ”的 问题 中 观 
察 到 了 这 样 的 一 个 结论 : 


Danger arises from Aliasing+Mutation 

目 先 我 们 介绍 一 下 这 两 个 概念 Aliass 和 Mutation 。 
(1) Alias 的 意思 是 “别名 ”。 如 果 一 个 变量 可 以 通过 多 种 Path 来 访 
问 ， 那 它们 就 可 以 互相 看 作 alias。Alias 意 味 着 “共享 "我 们 可 以 通过 
多 个 入 口 访问 同一 块 内 存 。 

(2) Mutation 的 意思 是 “改变 "。 如果 我 们 通过 某 个 变量 修改 了 一 

块 内 存 ， 束 古 发 生 了 mutation。Mutation 营 味 着 拥有 “修改 ”权限 ， 我 们 
可 以 写 入 数据 。 


Rnust 保 证 内 存 安全 的 一 个 重要 原则 就 是 ， 如 果 能 保证 alias 和 
mutation 不 同时 出 现 ， 那 么 代码 束 一 定 是 安全 的 。 


在 本 书 中 ， 笔 者 将 此 规则 总 结 为 ， 共 至 不 可 变 ， 可 变 不 共享 。 


向 


13.1 编译 错误 示例 


Rust 的 编译 错误 列表 (https://doc.rust-lang.org/error-index.html ) 
中 ， 从 E0499 到 E0509， 所 有 的 这 些 编译 错误 ， 其 实 都 在 讲 同一 件 事 
情 。 它 们 主要 关心 的 是 共 圣 和 可 变 之 间 的 关系。“ 共 享 不 可 变 ， 可 变 不 
共享 ”是 所 有 这 些 编译 错误 遵循 的 同样 的 法 则 。 


二 下 面 我 们 通过 几 个 简单 的 示例 来 直观 地 感受 一 下 这 个 规则 究竟 是 
么 意思 。 


不 例 一 


fn main() { 
let i = 0; 
let pi = & i; 
let p2 = & i; 
println!("{} {} {}", i, pi, p2); 


以 上 这 段 代 码 是 可 以 编译 通过 的 。 其 中 变量 绑 定 i、p1、p2 指 向 的 
是 同一 个 变量 ， 我 们 可 以 通过 不 同 的 path 访 问 同一 块 内 存 p，*p1， 
*p2， 所 以 它们 存在 “共享 "。 而且 它们 都 只 有 只 读 的 权限 ， 所 以 它们 存 
在 “共享 ”， 不 存在 “可 变 ”。 因 此 它 一 定 是 安全 的 。 


示例 二 


我 们 让 变量 绑 定 殉 可 变 的 ， 然 后 在 存在 p1 的 情况 下 ， 通 过 i 修 改 
变量 的 值 : 


fn main() { 
let mut i = 0; 
let pi = & i; 
工 三 工 ; 


} 


编译 ， 出 现 了 错误 ， 错 误 信 息 为 : 


error: cannot assign to ‘i because it is borrowed [E0506] 


这 个 错误 可 以 这 样 理解 : 在 存在 只 读 借 用 的 情 帝 下， 变量 姑 定 i 和 
pl 已 经 互 为 aliass， 它 们 之 间 存 在 “ 共 诗 ”， 因 此 必须 避免 “可 变 ”*”。 这 段 
代码 违反 了 “ 共 至 不 可 变 ” 的 原则 。 


示例 三 


如 果 我 们 把 上 例 中 的 借用 改 为 可 变 借 用 的 话 ， 其 实 是 可 以 通过 它 
修改 原来 变量 的 值 的 。 以 下 代码 可 以 编译 通过 : 


fn main() { 
let mut i = 0; 
let pi = &mut i; 
*p1 = 1; 

} 


那 我 们 是 不 古 说 ， 它 违反 了 “ 共 至 不 可 变 ” 的 原则 呢 ? 其实 不 是 。 
因为 这 段 代码 中 不 存在 “ 共 译 ”。 在 可 变 借用 存在 的 时 候 ， 编 译 紫 认为 
原来 的 变量 绑 定 记 经 被 冻结 (frozen) ， 不 可 通过 i 读 写 变量 。 此 时 有 
且 仅 有 p1 这 一 个 入 口 可 以 读 写 变 量 。 证 明 如 下 : 


fn main() { 
let mut i = 0; 
let pi = &mut i; 
“pl = 1; 
let x = i; // 通过 i 读 变 量 


在 存在 p1 的 情况 下 ， 我 们 再 通过 i 做 读 操作 是 错误 的 : 


error: cannot use ‘i because it was mutably borrowed [E0503] 
同 理 ， 如 有 果 我 们 改 成 下 面 这 样 ， 一 样 会 出 错 : 


fn main() { 
let mut i = 0; 
let p1 = &mut i; 


i = 1; // 通过 i 写 变量 


} 


在 pl 存在 的 情况 下 ， 不 可 通过 i 写 变量 。 如 果 这 种 情况 可 以 被 介 
许 ， 那 就 会 出 现 多 个 入 口 可 以 同时 访问 同一 块 内 存 ， 且 剖 具有 写 权 _ 
J 这 就 违反 了 Rust 的 “ 共 至 不 可 变 ， 可 变 不 共 至 ”的 原则 。 和 错误 信息 


error: cannot assign to ‘i because it is borrowed [E0506] 


示例 四 
同时 创建 两 个 可 变 借 用 的 情况 : 


fn main() { 
let mut i = 0; 
let pi = &mut i; 
let p2 = &mut i; 
} 


编译 错误 信息 为 : 


error: cannot borrow ‘i as mutable more than once at a time [E0499] 


因为 p1、p2 剖 是 可 变 代 用， 它们 都 指向 了 同一 个 变量 ， ea 
修改 权限 ， 这 是 Rust 不 允许 的 情况 ， 因 此 这 段 代 码 无 法 编译 通 


正 因 如 此 ，&mnut 型 借用 也 经 党 被 称 为 “独占 指针 ”，& 型 借用 也 经 
营 锌 称 为 “ 共 训 指针 ”。 


13.2 内存 不 安全 示例 : 修改 枚 举 
Rust 设 计 的 这 个 原则 ， 究 竟 有 没有 必要 呢 ? 它 又 是 如 何在 实际 代 


码 中 起 到 “内 存 安全 ”检查 作用 的 呢 ? 
第 一 个 示例 ， 我 们 用 enum 来 说 明 。 假 如 我 们 有 一 个 枚 举 类 型 : 


enum StringorInt { 
Str(String)， 
Int(i64), 


它 有 两 个 元 素 ， 分 别 可 以 携带 String 类 型 的 信息 以 及 i64 类 型 的 信 
思 。 假 如 我 们 有 一 个 引用 指 癌 了 它 的 内 部 数据 ， 同 时 再 修改 这 个 楼 
量 ， 大 家 猜想 会 发 生 什 么 情况 ? 这 样 做 可 能 会 出 现 内 存 安全 问题 ， 
为 我 们 有 机 会 用 一 个 String 类 型 的 指针 指 癌 i64 类 型 的 数据 ， 或 者 用 一 
个 i64 类 型 的 指针 指向 String 类 型 的 数据 。 完 整 示 例如 下 : 


use std::fmt::Debug; 


#[derive(Debug)] 
enum StringorInt { 
str(String), 


Int(i64), 


fn main() { 
use StringOrInt::{Str, Int}; 
Jet mut x = Str("Hello world".to_string()); 


If let Str(ref insides) =x{ 


x = INt(1); 


println!("inside is {}, x says: {:?}", insides, x); 


在 这 段 代 码 中 ， 我 们 用 if let 语 法 创建 了 一 个 指 癌 内 部 String 的 指 
针 ， 然 后 在 此 指针 的 生命 周期 内 ， 再 把 x 内 部 数据 变 成 64 类型。 这 是 
典型 的 内 存 不 安全 的 场景 。 

幸运 的 是 ， 这 段 代码 编译 不 通过 ， 错 误 信 息 为 : 


error: cannot assign to ‘x because it is borrowed [E0506] 


这 个 例子 给 了 我 们 一 个 直观 的 感受 ， 为 什么 Rust 需 要 “可 变性 和 共 
圣 性 不 能 同时 存在 ”的 规则 ? 保证 当前 只 有 一 个 访问 入 口 ， 这 有 是 你 证 安 
全 的 可 靠 做 法 。 


13.3 内存 不 安全 示例 : 送 代 情 僚 放 


如 果 在 过 历 一 个 数据 结构 的 过 程 中 修改 这 个 数据 结构 ， 会 导致 迭 
代 屡 失效 。 比 如 在 C++ 里 面 ， 我 们 可 能 写 出 这 样 的 代码 : 


#include <vector> 


using namespace std; 
int main() { 
vector<int> v(10,10); 


for (vector<int>::iterator i = Vv.begin(); i != v.end(); i++) { 
if (*i % 2 == 0) { // when arbitrary condition satisfied 
v.clear(); 
} 
return ©; 


} 


编译 ， 执 行 ， 发 现 程序 骨 溃 了 。 原 因 束 在 于 我 们 在 达 代 的 过 程 
中 ， 数 组 v 直 接 和 被 请 空 了 ， 而 和 欠 代 天 并 不 知道 这 个 信息 ， 它 还 在 继续 进 
行 适 代 ， 于 是 出 现 了 “ 野 指 针 ? 现 象 ， 此 时 和 迭代 事实 际 上 指 癌 了 已 经 被 
释放 的 内 存 。 迭 代 硕 失效 这 样 的 问题 在 C++ 中 和 是 “未 定义 行为 "， 也 束 
是 说 可 能 发 生 什 么 后 采 都 是 未 知 的 。 这 是 一 种 典型 的 内 存 不 安全 行 


然而 ， 在 Rust 里 面 ， 下 面 这 样 的 代码 是 不 允许 编译 通过 的 : 


fn main() { 
let mut arr = vec!["ABC", "DEF", "GHI"]; 
for item in &arr { 
arr.clear(); 


} 
} 


为 什么 Rust 可 以 避免 这 个 问题 呢 ? 因 为 Rust 里 面 的 for 循 环 实质 上 
苹 生成 了 一 个 达 代 紫 ， 它 一 直 持 有 一 个 指向 容 右 的 引用 ， 在 迭代 器 的 
生命 周期 内 ， 任 何 对 容 右 的 修改 都 是 无 法 编译 通过 的 。 类 似 这 样 : 


{ ”// 以 下 是 伪 代 码 
// 


在 iter 变 量 的 生 谷 


期 内 , 它 都 持 有 一 个 指向 arr 的 引 


于 
洱 


let iter<'a> = into_iter(&'a arr); 
loop I{ 
match iter.next() { 
// 如 果 需 要 使 用 arr 的 &mut 指针 , 则 会 发 生 冲 突 


一 : 


// &mut arr 和 &arr 不 能 同时 存在 , 它 违反 了 Rust 内 存 安全 的 原则 
Some(i) => { arr.clear(); } 
None => break ， 
} 
} 


} 


在 整个 for 循 环 的 范围 内 ， 这 个 迭代 妖 的 生命 周期 都 一 直 存 在 。 而 
它 持 有 一 个 指 问 容 右 的 引用 ，& 型 或 者 &mut 型 ， 根 据 情 况 而 定 。 送 代 
铬 的 API 设 计 是 可 以 修改 当前 指向 的 元 素 ， 没 办 法 修改 容器 本 壬 的 。 
当 我 们 想 在 这 里 对 容器 进行 修改 的 时 候 ， 必 然 需要 产生 一 个 新 的 针对 
容器 的 &mnut 型 引用 ， (clear 方 法 的 签名 是 Vec: : clear (&mnut 
self) ， 调 用 clear 必 然 产生 对 原 Vec 的 &mnut 型 引用 ) 。 这 是 与 Rust 
的 “aliasstmutation” 规 则 相 冲 突 的 ， 所 以 编译 不 通过 。 


为 什么 在 Rust 中 永远 不 会 出 现 友 代 研 失 效 这 样 的 错误 ”因为 通 
过 “mnutation+alias” 规 则 ， 束 可 以 完全 杜绝 这 样 的 现象 ， 这 个 规则 是 
Rust 内 存 安全 的 根 ， 古 解决 内 存 安全 问题 的 灵魂 。Rust 不 是 针对 各 式 
各 样 的 场景 ， 用 case by case 的 方式 来 解决 内 存 安全 问题 。 而 是 通过 一 
种 统一 的 机 制 ， 高 屋 建 领 地 解决 这 一 类 问题 ， 快 刀 斩 乱 及 ， 直 击 要 


号 


面 对 类 似 迄 代 右 失 效 这 一 类 的 、 指 针 指 向 非法 地 址 的 内 存 安全 问 
题 ， 许 多 语言 都 无 法 做 到 静态 检查 出 来 。 比 如 在 Java 中 出 现 这 样 的 问 
题 的 时 候 ， 编 译 器 是 没 法 检查 出 来 的 ， 在 执行 阶段 ， 程 序 会 抛 出 一 个 
异 单 “Exception in 
thread“main”java.util.ConcurrentModificationException”。 因为 我 们 在 for 
循环 内 部 对 容器 本 号 做 了 修改 ，Java 容 器 探测 到 了 这 种 修改 ， 然 后 就 
阻止 了 逻辑 的 继续 执行 ， 抛 出 了 异常 。Java 的 这 个 设计 相 比 C++ 要 好 
很 多 ， 因 为 即便 出 现 了 迭代 器 失效 ， 最 多 引发 异常 ， 而 并 不 会 有 “ 野 指 
针 ? 这 样 的 内 存 安全 问题 ， 因 为 欠 代 龙 没 有 机 会 访问 已 经 被 释放 的 非法 
内 存 。 然 而 “ 抛 出 异常 ”并 不 是 一 个 完美 的 设计 ， 只 是 不 得 已 而 为 之 要 
了 。 因 为 异常 本 来 的 设计 目的 是 为 了 处 理 外 部 环境 难以 预计 的 错误 
的 ， 而 现在 的 这 个 错误 实际 上 是 程序 的 逻辑 错误 ， 即 便 抛 出 了 腊 名 ， 
外 部 逻辑 捕获 了 这 个 异常 ， 也 没什么 好 办 法 来 处 理 。 唯 一 合理 的 修复 
方案 是 ， 发 现 这 样 的 异常 之 后 ， 回 过 头 来 修复 代码 错误 。 这 样 的 问题 


如 打 在 编译 阶段 融 能 得 到 发 现 和 解决 ， 才 是 最 合适 的 解决 方案 。 在 允 
历 容器 的 时 候 同 时 对 容器 做 修改 ， 可 能 出 现在 多 线程 场景 ， 也 可 能 出 
现在 单线 程 场景 。 


类 似 这 样 的 问题 依靠 GC 也 没 办 法 处 理 。GC 只 关心 内 存 的 分 配 和 
对 于 变量 的 读 写 权 限 是 不 关心 的 。GC 在 此 处 发 挥 不 了 什么 作 


而 Rust 依 靠 我 们 前 面 强 调 的 “alias+mutation” 规 则 就 可 以 很 好 地 和 解 
决 该 问题 。 这 个 思路 的 核心 束 是 :如 果 存 在 多 个 只 读 的 引用 ， 是 允许 
的 ; 如果 存 在 可 写 的 引用 ， 那 么 吏 一 定 不 能 同时 存在 其 他 的 只 读 或 者 
可 写 的 引用 。 大 家 看 到 这 个 逻辑 ， 是 不 是 马上 联想 到 多 线程 环境 下 
的 “ReadWriteLocker”? 事实 也 确实 如 此 。Rnust 检 查 内 存 安全 的 核心 还 
辑 可 以 理解 为 一 个 在 编译 阶段 执行 的 读 写 锁 。 多 个 读 同 时 存在 是 可 以 
的 ， 存 在 一 个 写 的 时 候 ， 其 他 的 读 写 都 不 能 同时 存在 。 


大 家 还 记 不 记得 ，Rust 设 计 痢 总 结 的 Rust 的 三 大 特点 : 一 是 快 ， 
二 是 内 存 安 全 ， 三 是 免除 数据 竞争 。 由 上 面 的 分 析 可 见 ，Rust 所 说 
的 “免除 数据 竞争 ”， 实 际 上 和 “内 存 安全 "是 一 回 事 。“ 免 除数 据 竞 
争 * 可 以 看 作 多 线程 环境 下 的 “内 存 安全 ”。 单 线程 环境 下 的 “内 存 安 
全 ” 靠 的 是 编译 阶段 的 类 似 读 写 锁 的 机 制 ， 与 多 线程 环境 下 其 他 语言 常 
用 的 读 写 锁 机 制 并 无 太 大 区 别 。 也 正 因为 Rust 编 译 絮 在 设计 上 打下 的 
民 好 基础 , “内 存 安全 "才能 轻松 地 扩展 到 多 线程 环境 下 的 "免除 数据 葛 
和 争 ”。 这 两 个 概念 其 实 只 有 一 箭 之 隔 。 所 以 我 们 可 以 理解 Java 将 此 异常 
命名 真实 含义 这 里 的 “Concurrent* 并 不 是 单 指 多 
线程 并 发 。 


13.4 ”内 和 存 不 安全 示例 : 芯 空 指针 


我 们 再 使 用 一 个 例子 ， 来 继续 说 明 为 什么 Rust 
的 “mutation+alias” 规 则 是 有 必要 的 。 我 们 这 次 通过 制造 一 个 蕊 空 指针 
来 解释 。 以 下 为 一 段 合理 的 C++ 代 码 ， 它 创建 了 一 个 动态 数组 ， 然 后 
使 用 了 一 个 指针 ， 指 癌 了 动态 数组 的 内 部 元 素 ， 然 后 我 们 向 动态 数组 
"He 然后 发 现 原先 的 指针 “ 蕊 空 "” 了 ， 它 指 癌 了 一 个 非法 的 地 


// 以 下 仅仅 为 了 示例 而 已 , 不 代表 推荐 的 C++ 编码 风格 
#include <vector> 
#include <iostream> 


using namespace std; 
int main() { 
vector<int> v(100, 5); 


// 指针 指向 内 部 第 一 个 元 素 
int * pO = &v[0]; 
cout << *pQO << endl; 


// 为 了 确保 v 发 生 扩容 , 多 插入 一 些 数据 
for (int i = 0; i<100; i++) { 
Vv.push_back(10); 


} 

// 打印 pg 的 内 容 

cout << *p0 << endl; 
return ©; 


编译 通过 ， 执 行 结果 为 : 
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熟悉 STL 的 朋友 肯定 知道 这 里 究竟 发 生 了 什么 。 动 态 数 组 是 目 行 
管理 内 存 空间 的 ， 在 问 动 态 数 组 内 部 添加 元 素 的 时 候 ， 如 末 超 过 了 当 
前 的 最 大 容量 ， 这 个 动态 数组 会 申请 一 块 更 大 的 连续 内 存 空间 ， 将 原 
0 释放 掉 之 前 的 内 存 空间 ， 然 后 继续 往 后 面 添 加 元 


我 们 的 指针 一 开始 是 指向 动态 数组 的 第 一 个 元 素 的 ， 但 是 当 往 动 
态 数 组 内 部 添加 多 个 元 系 之 后 ， 之 前 的 那 块 内 存 已 经 不 够 用 了 ， 动 态 
数组 在 这 个 过 程 中 已 经 将 原来 的 内 存 空间 释放 ， 并 申请 了 新 的 内 存 空 
间 。 于 是 ， 原 本 应 该 指 问 数组 第 一 个 元 素 的 指针 从 一 个 合法 的 指针 变 
成 了 指向 已 回收 内 存 区 域 的 晤 空 指针 ， 它 现在 指向 的 数据 古 与 原来 的 
意图 不 同 的 。 而 这 种 情况 正 是 属于 Rust 布 望 解决 的 “内 存 安全 ”问题 


我 们 来 看 看 用 Rust 写 会 发 生 什 么 。 同样， 使 用 动态 数组 类 型 ， 使 
站 元素， 然后 在 原来 的 动态 数组 中 插入 数 


fn main() { 
let mut arr : Vec<i32> = vec![1,2,3,4,5]; 
let p : &i32 = &arr[0]; 


error: cannot borrow ‘arr. as mutable because it is also borrowed as immutable 


我 们 可 以 看 到 , “mnutation+alias” 规 则 再 次 起 了 作用 。 在 存在 一 个 
不 可 变 引 用 的 情况 下 ， 我 们 不 能 修改 原来 变量 的 值 。 写 Rust 代 码 的 时 
修 ， 经 常会 有 这 样 的 感觉 ，Rust 编 译 右 极其 严格 ， 甚 至 人 到 了 “不 近 人 
情 ” 的 地 步 。 但 是 大 部 分 时 候 却 又 发 现 ， 它 指出 来 的 问题 的 确 是 对 我 们 
编程 有 益 的 。 对 它 使 用 越 熟 练 ， 越 觉得 它 是 一 个 好 帮手 。 


13.5 ”小 结 


Rust 在 内 存 安全 方面 的 设计 方案 的 核心 思想 是 “共享 不 可 变 ， 可 变 
不 共享 *。 


在 可 变性 控制 方面 ， 如 果 说 ，C 语 言 和 函数 式 编程 语言 分 属 一 个 
天 平 的 两 端 ， 那 么 Rust 吏 处 于 这 个 天 平 的 中 央 。C 语 言 的 思想 是 : 尺 
不 对 程序 员 做 限制 ， 尽 量 接近 机 右 确 层 ， 类 型 安全 、 可 变性 、 共 时 性 
都 由 程序 员 目 由 掌控 ， 语 言 本 身 不 提供 太 多 的 限制 和 规定 。 安 全 与 

人 否 ， 也 完全 取决 于 程序 员 。 而 函数 式 编 程 的 思想 是 : 尽量 使 用 不 可 变 
估 定 ， 在 可 变性 上 有 闫 格 限 制 ， 在 共 译 性 方面 没有 限制 。 函 数 式 编程 
0 


而 Rust 则 是 选择 了 折 中 的 方案 ， 既 允许 可 变性 ， 也 允许 共享 性 ， 
只 要 这 两 者 不 是 同时 出 现 即 可 。“ 共 至 不 可 变 ， 可 变 不 共 译 ”， 古 Rust 
保证 内 存 安全 和 线程 安全 的 “法 宝 ”。 而 我 们 可 以 看 到 ，Rust 的 这 个 设 
计 并 不 是 首 鼠 两 端 、 和 稀 泥 式 的 中 庸 之 道 ， 而 是 经 过 了 仔细 的 观察 羡 
结 、 严 席 的 设计 之 后 的 产物 。 


其 一 ， 相 比 函 数 式 设计 方式 ，Rust 并 没有 本 质 上 牺牲 安全 性 。 画 
数 式 编程 强调 的 “不 可 变 ” 特 性 ， 极 大 地 提升 了 安全 性 的 同时 ， 也 极 大 
地 提高 了 学 习 门 槛 。 而 Rust 在 “不 可 变 ” 要 求 上 的 理性 妥协 ， 实 现 了 在 
不 损失 安全 性 的 同时 ， 一 定 程度 上 也 降低 了 学 习 成 本 。 从 C/C++ 背景 
转 为 使 用 Rust 无 需 做 太 大 的 思维 转变 。 相 比 函 数 式 的 设计 方式 ，Rust 
的 入 站 门槛 更 低 。 虽 然 对 于 习惯 了 无 拘 无 束 目 由 挥 酒 的 C/C++ 编程 语 
言 的 朋友 来 说 ， 还 是 有 诸多 不 习惯 ， 但 毕竟 比 Haskell 要 容易 得 多 。 


其 二 ，Rust 针 对 传统 C/C++ 做 了 大 幅 改 进 ， 设 计 了 一 系列 静态 检 
查 规则 ， 来 防止 一 些 潜 在 的 bug。“ 共 至 不 可 变 ， 可 变 不 共 诗 ”就 古 其 中 
一 项 重要 的 规则 。 在 传统 的 C/C++ 中 ， 所 有 的 指针 都 是 同一 个 类 型 。 
从 功能 性 来 说 ， 这 样 设计 是 非常 强大 的 ， 但 它 缺 少 的 恰恰 是 一 定 程度 
的 取舍 ， 以 提高 安全 性 。 相 对 来 说 ，Rust 对 程序 员 的 限制 更 多 ， 有 所 
为 、 有 所 不 为 。 或 励 用 户 使 用 的 功能 应 当 越 容易 越 优雅 越 好 ;避免 用 
户 小 用 的 功能 应 当 越 困难 越 复杂 越 好 。 二 者 不 可 侦 废 。 


其 三 ，Rust 的 这 套 内 存 安全 体系 ， 不 需要 依赖 GC。 虽 然 现 在 GC 

的 性 能 越 来 越 好 ， 但 是 没有 GC 在 某 些 场景 下 依然 是 很 重要 的 。 没 有 

GC、 编 译 型 语言 的 特点 ， 和 是 Rust 执 行 性 能 的 羔 力 傈 证 。 这 束 是 为 什么 
Rust 设 计 组 有 压气 说 Rust 的 运行 性 能 与 C 语 言 处 于 同一 个 档次 的 原因 。 
当然 ， 目 前 的 Rust 还 很 年 轻 ， 许 多 优化 还 没有 实现 ， 但 这 不 要 紧 ， 单 
从 技术 层面 上 看 ， 还 有 许多 优化 在 可 行 性 上 是 没 问 题 的 ， 唯 一 需要 的 
征 时 间 和 工作 量 。 另 外 ， 没 有 GC 融 可 以 使 得 它 只 依赖 一 个 非常 轻 量 级 
的 runtime。 理 论 上 来 说 ， 它 可 以 用 于 许多 和 藤 入 式 平 台 ， 甚 至 可 以 在 无 
操作 系统 的 裸 机 上 执行 ， 使 用 Rust 编 写 操作 系统 也 是 完全 可 行 的 。 这 
站 


为 景 


其 四 ，Rust 的 核心 思想 “ 共 译 不 可 变 ， 可 变 不 共 吝 ”， 具 有 极 好 的 
一 致 性 和 扩展 性 。 它 不 仅 可 以 解决 内 存 安全 的 问题 ， 还 是 解决 线程 安 
全 的 基础 。 在 后 文中 我 们 会 看 到 ， 所 请 的 线程 安全 ， 实 质 上 就 是 内 存 
安全 在 多 线程 情况 下 的 目 然 延伸 。 反 过 来 ， 我 们 也 可 以 把 Rust 的 内 存 
安全 解决 方案 视 为 传统 的 线程 安全 机 制 Read Write Locker 的 编译 阶段 
执行 的 版 本 。 大 家 应 该 都 能 联想 到 ， 在 多 线程 环境 下 ， 数 据 范 争 问题 
征 怎 么 出 现 的 。 如 条 多 个 线程 对 同一 个 共享 变量 都 是 只 读 的 ， 它 是 安 
全 的 ; 如果 有 一 个 线程 对 共 至 变量 写 操作 ， 那 它 束 必须 是 独占 的 ， 不 
可 有 其 他 线程 继续 读 写 ， 否 则 束 会 出 现 数 据 苋 争 。 在 第 四 部 分 中 我 们 
还 会 发 现 ，Rust 里 面 的 许多 线程 安全 的 类 型 ， 与 一 些 非 线程 安全 的 类 
型 ， 具 有 非常 有 趣 的 对 称 性 。 


由 此 我 们 可 以 看 出 ，Rust 的 这 套 设 计 方 案 的 确 是 有 创新 性 的 。 它 
走出 了 一 条 前 无 古人 的 道路 。Rust 在 其 他 方面 的 功能 ， 都 不 能 被 称 作 
原创 设计 ， 都 是 从 其 他 编程 语言 中 学 过 来 的 。 唯 独 安全 性 方面 的 设计 
是 独一无二 的 。 只 要 我 们 保证 了 “ 共 至 不 可 变 ， 可 变 不 共 译 ”， 我 们 整 
可 以 保证 内 存 安全 。 那 么 它 这 套 设计 方案 ， 究 竟 能 不 能 被 大 众 所 接 受 
呢 ? 我 们 拭目以待 。 


另外 ， 这 个 规定 是 否 旦 过 于 疡 可 了 呢 ? 会 不 会 大 幅 前 弱 代 码 的 表 
达能 力 ? 后 面 我 们 还 需要 进一步 分 析 。 


第 14 章 NLL (Non-Lexical-Lifetime) 


Rust 防 范 “ 内 存 不 安全 ”代码 的 原则 极其 清晰 明了 “。 如 采 你 对 同一 
块 内 存 存 在 多 个 引用 ， 就 不 要 试图 对 这 块 内 存 做 修改 ; 如 果 你 需要 对 
一 块 内 存 做 修改 ， 束 不 要 同时 保留 多 个 引用 。 只 要 保证 了 这 个 原则 ， 
我 们 束 可 以 人 证 内 存 安全 。 它 在 实践 中 发 挥 了 强大 的 作用 ， 可 以 帮助 
La 。 这 个 原则 是 Rust 的 立身 之 本 、 生 命 之 基 、 活 力 之 
源 。 


这 个 原则 是 没 问 题 的 ， 但 是 ， 初 始 的 实现 版 本 有 一 个 主要 问题 ， 
那 束 是 它 让 借用 指针 的 生命 周期 规则 与 普通 对 象 的 生命 周期 规则 一 
样 ， 是 按 作 用 域 来 确定 的 。 所 有 的 变量 、 借 用 的 生命 周期 整 古 从 它 的 
声明 开始 ， 到 当前 整个 语句 块 结束 。 这 个 设计 被 称 为 Lexical 
Lifetime， 因 为 生命 周期 是 严格 和 词法 中 的 作用 域 范围 绑 定 的 。 这 个 人 案 
略 实现 起 来 非常 简单 ， 但 它 可 能 过 于 保守 了 ， 某 些 情况 下 借用 的 范围 
被 过 度 拉 长 了 ， 以 至 于 某 些 实质 上 是 安全 的 代码 也 被 阻止 了 。 在 某 些 
场景 下 ， 限 制 了 程序 员 的 发 挥 。 


因此 ，Rust 核 心 组 又 决定 引入 Non Lexical Lifetime， 用 更 精细 的 手 
段 调 和 借用 真正 起 作用 的 范围 。 这 了 就 是 NLL。 


注意 ， 在 编写 本 书 时 ， 该 功能 在 编译 侨 中 只 实现 了 一 小 部 分 。 


14.1 ”NLL 希望 解决 的 问题 
首先 ， 我 们 来 看 几 个 简单 的 示例 。 


Use std::ascii::AsciiExt; 


fn foo() -> Vec<char> { 


let mut data = vec!['a', 'b', 'c']; // --+ 'Scope 
a i datal[..]); // | 

7/ NS 'lifetime // | 
人 push('d'); // | 
data.push('e'); // | 
data.push('f"); // | 
data // | 

// <----------------------------------------- + 


fn capitalize(data: &mut [char]) { 
for c in data { 
c.make_ascii_ uppercase(); 
} 


} 


fn main() { 
let v = foo(); 
println!i("{:?}", Vv); 


这 段 代码 是 没有 问题 的 。 我 们 的 关注 点 是 foo () 这 个 函数 ， 它 在 
调用 capitalize 函 数 的 时 候 ， 创 建 了 一 个 临时 的 &mut 型 引用 ， 在 它 的 调 


用 结束 后 ， 这 个 临时 的 借用 束 终 止 了 ， 因 此 ， 后 面 我 们 束 可 以 再 用 


data 去 修改 数据 。 注 意 ， 这 个 临时 的 &mut 引 用 存在 的 时 间 很 短 ， 画 数 


调用 结束 ， 它 的 生命 周期 就 结束 了 。 
但 是 ， 如 果 我 们 把 这 段 代 码 稍 作 修 改 ， 问 题 束 出 现 了 : 


fn foo() -> Vec<char> { 


let mut data = vec!['a', 'b', 'c']; // --+ 'scope 
let slice = &mut data[..];// <----------- + "ifetime 
capitalize(slice); // | 
data.push('d'); //ERROR // | 
data.push('e'); //ERROR // | 
data.push('f'); //ERROR // | 

data //ERROR // | 

// <----------------------------------------- + 


在 这 段 代 人 码 中 ， 我 们 创建 了 一 个 临时 变量 slice， 保 存 了 一 个 指 回 
data 的 &mut 型 引用 ， 然 后 再 调用 capitalize 函 数 ， 就 出 问题 了 。 编 译 器 
提示 为 : 


error[E0499]: cannot borrow data ”as mutable more than once at a time 


这 是 因为 ，Rust 规 定 “ 共 享 不 可 变 ， 可 变 不 共享 ”， 同 时 出 现 两 个 
&mnut 型 借用 是 违反 规则 的 。 在 编译 需 报 错 的 地 方 ， 编 译 事 认为 slice 依 
然 存 在 ， 然 而 又 使 用 data 去 调用 fn push (&mut self，value: T) 方法 ， 
必然 又 会 产生 一 个 &mnut 型 借用 ， 这 违反 了 Rnust 的 原则 。 在 目前 这 个 版 
本 中 ， 如 有 果 我 们 要 修复 这 个 问题 ， 只 能 这 样 做 : 


fn foo() -> Vec<char> { 
let mut data = vec!['a', 'b', 'c']; // --+ 'Sscope 


let slice = &mut datal[..]; // <------- + ']ifetime 
capitalize(slice); // | 
// <------------------------------------ + 


data.push('d'); 
data.push('e'); 
data.push('f"); 
data 


我 们 手动 创建 了 一 个 代码 块 ，i 上 slice 在 这 个 子 代码 块 中 创建 ， 后 
面 束 不 会 产生 生命 周期 冲突 问题 了 。 这 是 因为 ， 在 早期 的 编译 如 内 部 
实现 里 面 ， 所 有 的 变量 ， 包 括 引 用 ， 它 们 的 生命 周期 都 是 从 声明 的 地 
方 开始 ， 到 当前 语句 块 结束 (不 考虑 所 有 权 转 移 的 情况 ) 。 


这 样 的 实现 方式 意味 着 每 个 引用 的 生命 周期 都 是 跟 代 码 块 
(scope) 相关 联 的 ， 它 总 是 从 声明 的 时 候 被 创建 ， 在 退出 这 个 代码 块 
的 时 候 被 销毁 ， 因 此 可 以 称 为 Lexical lifetime。 而 本 章 所 说 的 Non- 
Lexical lifetime， 意 思 了 天 是 取消 这 个 关联 性 ， 引 用 的 生命 周期 ， 我 们 用 
男 外 的 、 更 智能 的 方式 分 析 。 有 了 这 个 功能 ， 上 例 中 手动 加 入 的 代码 
块 束 不 需要 了 ， 编 译 右 应 该 能 日 动 分 析出 来 ，slice 这 个 引用 在 
capitalize 函 数 调用 后 就 再 没有 被 使 用 过 了 ， 它 的 生命 周期 完全 可 以 束 
此 终止 ， 不 会 对 程序 的 正确 性 有 任何 影响 ， 后 面 再 调用 push 方 法 修改 
数据 ， 其 实 跟前 面 的 slice 并 没有 什么 冲突 关系 。 


看 了 上 面 这 个 例子 ， 可 能 有 人 还 会 觉得 ， 显 式 的 用 一 个 代码 块 来 
规定 局 部 变量 的 生命 周期 是 个 更 好 的 选择 ，Non-Lexical-Lifetime 的 意 
义 似乎 并 不 大 。 那 我 们 再 继续 看 看 更 复杂 的 例子 。 我 们 可 以 发 现 ， 
Non-Lexical-Lifetime 可 以 打开 更 多 的 可 能 性 ， 让 用 户 有 机 会 用 更 直观 
的 方式 写 代 码 。 比 如 下 面 这 样 的 一 个 分 文 结构 的 程序 : 


fn process_ or_default<K,V:Default> 
(map: &mut HashMap<K,V>, key: K) 


match map.get_ mut(&key) { // ------------- + "ifetime 
Some(value) => process(value), // | 
None => { // | 
map.insert(key, V::default()); // | 
AAA ERROR. // | 
// | 
} // < + 


这 段 代码 从 一 个 HashMap 中 查询 某 个 key 是 否 存在 。 如 有 果 存 在 ， 欢 
继续 处 理 ， 如 果 不 存在 ， 就 插入 一 个 新 的 值 。 目 前 这 段 代码 是 编译 不 
过 的 ， 因 为 编译 器 会 认为 在 调用 get_mut (&key) 的 时 候 ， 产 生 了 一 个 
指向 map 的 &mut 型 引用 ， 而 且 它 的 返回 值 也 包 合 了 一 个 引用 ,返回 值 
的 生命 周期 是 和 参数 的 生命 周期 一 致 的 。 这 个 方法 的 返回 值 会 一 直 存 
在 于 整个 match 语 句 块 中 ， 所 以 编译 亏 判 定 ， 针 对 map 的 引用 也 是 一 直 
存在 于 整个 match 语 句 块 中 的 。 于 是 后 面 调用 insert 方 法 会 发 生 冲突 。 


当然 ， 如 果 我 们 从 逻辑 上 来 理解 这 段 人 代码， 就 会 知道 ， 这 上段 代码 
其 实 是 安全 的 。 因 为 在 None 分 文 ， 意 味 着 map 中 没有 找到 这 个 key， 在 
这 条 路 径 上 目 然 也 没有 指 加 map 的 引用 存在 。 但 是 可 惜 ， 在 老 版 本 的 
编译 器 上 ， 如 果 我 们 希望 让 这 上 段 代 码 编 译 通 过 ， 只 能 绕 一 下 。 我 们 试 
一 下 做 如 下 的 修复 : 


fn get_default1i<'m,K,V:Default>( 
map: &'m mut HashMap<K,V>, key: K) 


-> &'m mut V 

match map.get_mut(&key) { // ------------- + 'm 
Some(value) => return value, // | 
None => { } // | 

} ZL | 

map.insert(key, V::default()); // | 

// 人 ^~~~~~ ERROR (still) | 

map.get_mut(&key).unwrap() // | 


实际 上 这 个 改动 依然 会 编译 失败 。 原 因 束 在 于 return 语 名 ， 
get_mut 时 候 对 map 的 借用 传递 给 J Some (value) ， 在 Some 这 个 分 支 
内 存在 一 个 引用 ， 指向 map 的 菜 个 六 部 分 ， 而 我 们 又 把 value 返 回 了 ， 这 
意味 着 编译 器 认为 ， 这 个 借用 从 match 开 始 一 直到 退出 这 个 函数 都 存 
在 。 因 此 后 面 的 insert 调 用 依然 发 生 了 神 突 。 接 下 来 我 们 再 做 一 次 修 
复 : 


fn get_default2<'m,K,V:Default>( 
map: &'m mut HashMap<K,V>, 
key: K) 
-> &'m mut V 


{ 
If map.contains(&key) 全 
yy 
return match map. 人 mut(&key) { //+ 'm 
Some(value) => value, // | 
None => unreachable!() // | 
//V 
} 
// At this point, ‘map.get mut was never 
// called! (As opposed to having been called, 
// but its result no longer being in use.) 
map.insert(key, V::default()); // OK now. 
map.get_mut(&key).unwrap() 
} 


这 次 的 区 别 在 于 ， get_mut 发 生 在 一 个 于 语句 块 中 ° 在 这 种 情况 
下 ， 编 译 器 会 认为 这 个 借用 跟 if 外 面 的 代码 没什么 关系。 通过 这 种 方 
式 ， 我 们 终于 各 过 了 bomow checker。 但 是 ， 为 了 绕 过 编译 屁 的 限制 ， 
我 们 付出 了 一 些 代价 。 这 段 代码 ， 我 们 需要 执行 两 次 hash 查 找 ， 一 次 
在 contains 方 法 ， 一 次 在 get_mut 方 法 ， 因 此 它 有 额外 的 性 能 开销 。 这 
也 是 为 什么 标准 库 中 的 HashMap 设 计 了 一 个 叫 作 entry 的 api， 如 果 用 
entry 来 写 这 段 逻 辑 ， 可 以 这 么 做 : 


fn get_default3<'m,K,V:Default>( 

map: &'m mut HashMap<K,V>, 

key: K) 

-> &'m mut V 

{ 

map.entry(key) 

.Or_insert with(|| V::default()) 

} 


这 个 设计 既 清晰 简洁 ， 也 没有 额外 的 性 能 开销 ， 而 且 不 需要 Non- 
Lexical-Lifetime 的 文 持 。 这 说 明 ， 虽 然 老 版 本 的 生命 周期 检查 确实 有 
点 过 于 严格 ,但 至 少 在 某 些 场景 下 ， 我 们 其 实 还 是 有 办 法 绕 过 去 的 ， 
不 一 定 要 在 “ 民 好 的 抽象 *? 和 “安全 性 ”之 间 做 选择 。 但 是 它 付出 了 其 他 
的 代价 ， 那 就 是 设计 难度 更 高 ， 更 不 容易 说 掌 握 。 标 准 库 中 的 entry 
API 也 是 很 多 高 手 经 过 很 长 时 间 才 最 终 设计 出 来 的 产物 。 对 于 普通 用 
户 而 言 ， 如 果 在 其 他 场景 下 出 现 了 类 似 的 冲突 ， 丽 介 大 部 分 人 都 没有 
能 力 想 到 一 个 最 佳 方案 ， 可 以 既 避 过 编译 絮 限 制 ， 又 不 损失 性 能 。 所 
以 在 实践 中 的 很 多 场景 下 ， 普 通用 户 做 不 到 “ 零 开 销 抽 象 ”。 


让 编译 做 能 更 准确 地 分 析 借用 指针 的 生命 周期 ， 不 要 简单 地 与 
scope 相 绑 定 ， 不 论 对 普通 用 户 还 是 高 阶 用户 都 是 一 个 更 合理 、 更 有 用 
的 功能 。 如 采编 译 套 能 有 这 么 聪明 ， 那 么 它 应 该 能 理解 下 面 这 段 代码 
其 实 是 安全 的 : 


match map.get_ mut(&key) { 
Some(value) => process(value)，// 找到 了 就 继续 处 理 这 个 值 
None => 
map.insert(key，V::default()); // 没 找到 key 就 插入 一 个 新 的 值 


这 段 代 码 既 符合 用 户 直观 思维 模式 ， 又 没有 破坏 Rust 的 安全 原 
则 。 以 前 的 编译 凑 无 法 编译 通过 ， 实 际 上 有 坪 对 正确 程序 的 误伤 ， 是 一 
种 应 该 修复 的 缺陷 。NLL 的 设计 目的 就 是 让 Rust 的 安全 检查 更 加 准 
确 ， 减 少 误 报 ， 使 得 编译 右 对 程序 员 的 而 肘 更 少 。 


打开 NLL 功能 ， 以 下 代码 就 可 以 编译 通过 了 : 


#![feature(ni1l1)] 
use std::collections::HashMap,; 
fn process_or_default4(map: &mut HashMap<String, String>, key: String) 
match map.get_ mut(&key) { 
Some(value) => println!("{}", value), 
None => 


map.insert(key, String::new()); 


} 
} 


fn main() { 


let mut map = HashMap: :<String，String>::new()， 
let key = String::from("abc"); 
process_or_default4(&mut map, key); 


14.2 ”NLL 的 原理 


NLL 的 设计 目的 是 让 “借用 ”的 生命 周期 不 要 过 长 适可而止， 避免 
不 必要 的 编译 错误 ， 把 实际 上 正确 的 代码 也 一 起 拒绝 挥 。 但 十 实现 方 
法 不 能 是 简单 地 在 AST 上 找 以 下 某 个 引用 最 后 一 次 在 哪里 使 用 ， 融 让 
它 的 生命 周期 结束 滤 了 。 我 们 用 例子 来 说 明 : 


fn baz() { 


let mut data = vec!['a', 'b', 'c']; 
let slice = &mut data[..]; // <-+ lifetime If we ignored 
loop { // | variables altogether 
capitalize(slice); // | 
// <------------------------ + 
data.push('d'); // Should be error, but would not be. 
data.push('e'); // OK 
data.push('f'); // OK 


在 这 个 示例 中 ， 我 们 引入 了 一 个 循环 结构 。 如 果 我 们 只 是 分 析 
AST 的 结构 的 话 ， 很 可 能 会 觉得 capitalize 函 数 结束 后 ，slice 的 生命 周期 
就 结束 了 ， 因 此 data.push () 方法 调用 是 合理 的 。 但 这 个 结论 是 错误 
的 ， 因 为 这 里 有 一 个 循环 结构 。 大 家 想 想 看 ， 如 果 执 行 了 push () 方 
法 后 ， 引 发 了 Vec 数 据 结构 的 扩容 ， 它 把 以 前 的 空间 释放 掉 ， 申 请 了 新 
的 空间 ， 进 入 下 一 轮 循环 的 时 候 ，slice 就 会 指向 一 个 非法 地 址 ， 会 出 现 
内 存 不 安全 。 以 上 这 段 代 码 理 应 出 现 编译 错误 。 


因此 ， 新 版 本 的 借用 检查 器 将 不 再 基于 AST 的 语句 块 来 设计 ， 而 
是 将 AST 转 换 为 另外 一 种 中 间 表 达 形 式 MIR (middle-level intermediate 
representation) 之 后 ， 在 MIR 的 基础 上 做 分 析 。 这 是 因为 前 面 已 经 分 析 
过 了 ， 对 于 复杂 一 点 的 程序 逻辑 ， 基 于 AST 来 做 生命 周期 分 析 是 费力 
不 讨好 的 事情 ， 而 MIR 则 更 适合 做 这 种 分 析 。 读 者 可 以 用 以 下 编译 履 
命令 打印 出 MIR 的 文本 格式 : 


rustc --emit=mir test.rs 


不 过 在 一 般 情 况 下 ，MIR 在 编译 恬 内 部 的 表现 形式 是 内 存 中 的 一 
组 数据 结构 。 这 些 数据 结构 描述 的 是 一 个 叫 作 “ 控 制 流 图 ” (control flow 


graph) 的 概念 。 所 请 控制 流 图 ， 束 是 用 “图 ”这 种 数据 结构 ， 描 述 程序 
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fn send_if2(data: Vec<Data>) { 
If some condition(&data) { 
send_to_other_thread(data); 
return; 


} 


process(&data); 


生成 的 控制 流 图 如 图 14-1 所 示 。 


图 上 面 有 广 态 ， 也 有 边 。 市 点 代表 一 条 或 者 一 组 语句 ， 边 代表 分 
文 跳 转 。 有 了 这 个 图 ， 引 用 的 生命 周期 束 可 以 用 这 个 图 上 的 节 扣 来 表 
示 了 。 编 译 此 最 后 会 分 析出 来 ， 引 用 在 这 个 图 上 的 哪些 条 点 上 还 十 活 
着 的 ， 在 哪些 证 点 上 可 以 看 作 已 经 死 控 了。 相 比 于 以 前 ， 一 个 引用 的 
生命 周期 直接 充满 整个 语句 块 ， 现 在 的 表达 方式 明显 要 精细 得 多 ， 这 
样 我 们 就 可 以 保证 引用 的 生命 周期 不 会 被 过 分 拉 长 。 


send to other thread(data) 


if some condition (&data) 


false 


process (&data) 
drop (data) 


return 


图 14-1 
这 个 新 版 的 借用 分 析 器 ， 会 允许 下 面 的 代码 编译 成 功 ， 比 如 : 


#![feature(n1ll)] 

fn main() { 
let mut v = vec![1,2,3,4,5]; 
VvV.push(v.len()); // 同一 行 , 既 有 & 型 借用 ,也 有 &mut 型 借用 。 但 逻辑 上 是 安全 的 
printin!("{:?}", VvV); 

} 


目前 版 本 中 ， 如 果 去 掉 #1 [feature (nll) ] 就 会 出 现 编译 错误 。 
再 比如 : 


#![feature(n1ll)] 

fn main() { 
let mut data = 100 i32; 
let mut p = &data; // p is live 
printin!("{}", p); // p is dead 


data = 101; 
p = &data; // p is live again 
printin!("{}", p); // p is dead again 


上 面 这 个 示例 启用 了 新 的 生命 周期 分 析 器 后 ， 也 可 以 编译 成 功 。 
它 不 会 再 把 p 指 针 的 生命 周期 当成 从 声明 到 语句 块 结束 ， 而 是 聪明 地 坦 
出 了 到 第 一 次 printm! 就 可 以 结束 了 ， 后 面 的 data 又 重新 赋值 的 时 候 不 
会 跟 它 冲突 。 

另外 需要 强调 的 是 : 

这 个 功能 只 影响 静态 分 析 结 果 ， 不 影响 程序 的 执行 情况 ， 


:以 前 能 编译 通过 的 程序 以 后 依然 会 编译 通过 ， 不 会 影响 以 前 的 代 


码 ; 
: 它 依然 保证 了 安全 性 ， 只 是 将 以 前 过 于 保守 的 检查 规则 适当 放 
和 所; 


它 依赖 的 依然 是 静态 检查 规则 ， 不 会 涉及 任何 动态 检查 规则 ; 


' 它 只 影响 < 引用 类 型 > 的 生命 周期 ， 不 影响 "对象 "的 生命 周期 ， 即 
维持 现 有 的 析 构 函数 调用 时 机 不 变 ; 


. 它 不 会 影响 RAII 语 义 。 


在 编写 本 书 之 时 ， 此 功能 还 没有 完全 实现 ， 但 是 鉴于 该 功能 的 重 
要 性 ， 笔 者 依然 觉得 非常 有 必要 向 各 位 读者 提前 介绍 。 希 望 该 功能 尽 


快 完成 ， 以 减少 不 必要 的 编译 错误 对 新手 的 困扰 。 


1 A 


内 存 安全 是 需要 一 些 代码 规范 来 约束 才能 实现 的 。 这 就 好 比 交 通 
安全 是 需要 交通 法 规 来 约束 才能 实现 一 样 。 我 们 不 能 因为 某 个 具体 的 
人 在 某 个 具体 的 路 段 上 不 能 直达 目标 ， 不 得 不 绕 路 而 行 ， 而 否定 整个 
交通 法 规 的 意义 。 交 通 法 规 本 喘 肯 定 还 有 值得 优化 的 地 方 ， 但 它 优 化 
的 方 同 应 该 是 让 社会 平均 交通 事故 率 下 降 ， 拓 高 社会 平均 通行 效率 ， 
不 能 着 眼 于 特定 时 间 特 定位 置 。NLL 的 设计 就 是 朝 这 个 方向 前 进 的 。 
Rust 中 的 生命 周期 是 一 个 初学 者 不 易 理 解 的 难点 ， 而 且 也 确实 存在 一 
些 情况 损害 了 语言 的 表达 能 力 。 但 我 们 不 应 该 轻易 地 否定 生命 周期 这 
个 设计 ， 而 是 应 该 做 一 些 更 精细 的 、 准 确 的 调整 ， 使 它 尽 可 能 接近 “ 安 
全 ”与 “不 安全 ”的 那 条 分 界线 ， 不 偏 不 位 ， 否 则 宽 严 弓 误 。 


在 C/C++ 的 领域 ， 为 了 提高 软件 可 靠 性 而 设计 的 代码 规范 其 实 有 
很 多 ， 这 些 先贤 总 结 出 来 的 C/C++ 的 设计 范式 和 惯用 法 是 非常 有 利于 
提高 代码 质量 、 降 低 安 全 风险 的 。 但 是 可 惜 的 是 ， 这 些 民 好 的 设计 范 
式 并 不 是 所 有 人 都 能 遵守 的 ， 束 好 比 大 街 上 总 十 有 人 试图 抄 近 路 ， 违 
反 交 通 规 则 而 导致 交通 事故 一 样 。 这 些 人 不 理解 一 个 统一 的 代码 规范 
对 于 整个 项 目 代 码 质 量 的 意义 。 一 旦 在 项 目 中 掺 入 了 一 些 市 有 “ 坏 味 
道 ” 的 代码 ， 那 它 束 不 一 定 在 哪 天 给 项 目 市 来 一 个 出 其 不 意 的 问题 ， 哪 
怕 只 是 一 个 简单 的 赋值 、 函 数 调 用 ， 痢 可 能 触发 完全 超过 预期 的 结 
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A rule is worthless if it is not enforced. 如 果 规 则 不 能 强制 执行 ， 那 
入 这 个 规则 就 是 没有 价值 的 。 因 此 ，C/C++ 的 领域 内 也 出 现 了 一 大 批 
静态 代码 检查 工具 。 这 些 工 具 可 以 帮助 我 们 提高 代码 规范 的 严肃 性 和 
可 执行 性 ， 从 而 间接 增强 代码 的 可 靠 程 度 。 但 是 可 惜 的 是 ，C/C++ 的 
静态 代码 检查 工具 远 称 不 上 完美 ， 它 总 会 有 误 报 或 者 漏 报 的 情况 发 
生 。 而 Rust 则 在 这 个 方 辐 上 更 进 了 一 步 ， 保 证 了 segment fault 这 一 类 内 
存 安全 问题 ， 可 以 在 静态 代码 检查 阶段 “完整 无 遗漏 * 地 被 检查 出 来 。 


Rust 之 所 以 能 达到 这 么 好 的 检查 效果 ， 并 不 是 因为 设计 者 发 明了 
什么 高 深 的 算法 ， 或 者 比 做 C/C++ 静态 检查 的 人 更 聪明 。 主 要 原因 是 
设计 者 们 “ 作 次 "了 ， 他 们 直接 简化 了 被 研究 对 象 。C/C++ 由 于 本 质 上 
的 灵活 性 太 强 ， 使 得 某 些 安全 问题 检查 极其 难以 实现 。 而 Rust 在 设计 


的 时 候 束 一 直 将 这 些 问 题 考虑 在 内 ， 所 有 的 功能 都 不 能 影响 "内 存 安 


全 ”的 设计 。 


当然 ，Rust 的 这 种 设计 目 然 瑟 融 来 了 Rust 独 有 的 新 的 设计 范式 。 
有 些 C/C++ 风 格 的 代码 在 Rust 里 面 束 很 难 写 出 来 ， 但 这 并 不 一 定 意味 
着 “表达 能 力 低 ”， 往 往 是 因为 用 地 道 的 Rust 处 理 同 样 的 问题 是 另外 一 
种 你 不 熟悉 的 风格 而 已 。 要 搞 清 楚 这 种 Rust 风 格 的 代码 完 葛 是 怎样 
的 ， 束 需要 多 读 高 质量 的 开源 的 Rust 代 码 来 培养 感觉 。 


第 15 章 ”内 部 可 变性 


Rnust 的 borrow checker 的 核心 思想 是 “共享 不 可 变 ， 可 变 不 共享 ”。 
但 是 只 有 这 个 规则 是 不 够 的 ， 在 某 些 情况 下 ， 我 们 的 确 需 要 在 存在 共 
享 的 情况 下 可 变 。 为 了 让 这 种 情况 是 可 探 的 、 安 全 的 ，Rust 还 设计 了 
一 种 “内 部 可 变性 ” (interior mutability) 


“内 部 可 变性 ”的 概念 ， 是 与 “承袭 可 变性 ” (inherited mutability) 
相对 应 的 。 大 家 应 该 注意 到 了 ，Rust 中 的 mut 关 键 字 不 能 在 声明 类 型 的 
时 候 使 用 ， 只 能 跟 变 量 一 起 使 用 。 类 型 本 身 不 能 规定 自己 是 否 是 可 变 
的 。 一 个 变量 是 否 是 可 变 的 ， 取 决 于 它 的 使 用 环境 ， 而 不 是 它 的 类 
型 。 可 变 还 是 不 可 变 取 决 于 变量 的 使 用 方式 ， 这 就 叫 作 “承袭 可 变 
性 ”。 如 果 我 们 用 let var: T; 声明， 那么 var 是 不 可 变 的 ， 同 时 ，var 内 
部 的 所 有 成 员 也 都 是 不 可 变 的 ; 如 果 我 们 用 let mut var: T; 声明 ， 那 
么 Var 是 可 变 的 ， 相 应 的 ， 它 的 内 部 所 有 成 员 也 都 是 可 变 的 。 我 们 不 能 
在 类 型 声明 的 时 候 指 定 可 变性 ， 比 如 在 struct 中 对 某 部 分 成 员 使 用 mut 
修饰 ， 这 是 不 合法 的 。 我 们 只 能 在 变量 声明 的 时 候 指 定 可 变性 。 我 们 
也 不 能 针对 变量 的 某 一 部 分 成 员 指 定 可 变性 ， 其 他 部 分 保持 不 变 。 

常见 的 具备 内 部 可 变性 特点 的 类 型 有 Cell、RefCell、Mutex、 


RwLock、Atomic* 等 。 其 中 Cell 和 RefCell 是 只 能 用 在 单线 程 环 境 下 的 
具备 内 部 可 变性 的 类 型 。 下 面 就 来 讲解 何 为 “内 部 可 变性 ”。 


15.1 Cell 


按照 前 面 的 理论 ， 如 采 我 们 有 共 吾 引用 指 问 一 个 对 象 ， 那 么 这 个 
对 和 象 融 不 会 被 更 改 了 。 因 为 在 共享 引用 存在 的 期 间 ， 不 能 有 可 变 引 用 
同时 指向 它 ， 因 此 它 一 定 是 不 可 变 的 。 其 实在 Rust 中 ， 这 种 想法 是 不 
准确 的 。 下 面 给 出 一 个 示例 : 


USe std::rc::Rc; 
fn main() { 
let ri = Rc: :new(1); 
println!("reference count {}", Rc::strong_count(&r1)); 
let r2 = ri.clonel(); 
println!("reference count {}", Rc::strong_count(&r2)); 


} 
编译 ， 执 行 ， 结 果 为 ， 


reference count 1 
reference count 2 


Rc 是 Rust 里 面 的 引用 计数 智能 指针 ， 在 后 文中 我 们 还 会 继续 讲 
解 。 多 个 Rc 指针 可 以 同时 指 疝 同一 个 对 象 ， 而 且 有 一 个 共 至 的 引用 计 
数值 在 记录 忌 共 有 多 少 个 Rc 指针 指 癌 这 个 对 象 。 


注意 Rc 指 针 提 供 的 是 共享 引用 ， 按 道理 它 没 有 修改 共享 数据 的 能 
力 。 但 是 我 们 用 共享 引用 调用 clone 方 法 ， 引 用 计数 值 发 生 了 变化 。 这 
束 是 我 们 要 说 的 “内 部 可 变性 *”。 如 果 没 有 内 部 可 变性 ， 标 准 库 中 的 Re 
类 型 是 无 法 正确 实现 出 来 的 。 具 备 内 部 可 变性 的 类 型 ， 最 典型 的 就 是 
Cell 。 


现在 用 一 个 更 浅显 的 例子 来 演示 一 下 Cell 的 能 


use std::cell::Cell; 


fn main() 
let data : Cell<i32> = Cell: :new(100); 
let p = &data; 
vdata. set (10); 


println!("{}", p.get()); 


p.set(20); 
println!("{:?}", data); 


这 次 编译 通过 ， 执 行 ， 结 果 是 符合 我 们 的 预期 的 : 


10 
Cell { value: 20 } 


请 注意 这 个 例子 最 重要 的 特点 。 和 需要 注意 的 古 ， 这 里 的 “可 变 
性 "问题 跟 我 们 前 面 见 到 的 情况 不 一 样 了 。data 这 个 变量 绑 定 没有 用 
mut 修 饰 ，p 这 个 指针 也 没有 用 &mut 修 饰 ， 然 而 不 可 变 引 用 竟然 可 以 调 
用 set 范 数 ， 改 变 了 变量 的 值 ， 而 且 还 没有 出 现 编译 错误 。 


这 就 是 所 谓 的 内 部 可 变性 这 种 类 型 可 以 通过 共享 指针 修改 它 
内 部 的 值 。 虽 然 粗 略 一 看 ，Cell 类 型 似乎 违反 了 Rust 的 “唯一 修改 权 ” 原 
则 。 我 们 可 以 存在 多 个 指向 Cell 类 型 的 不 可 变 引 用 ， 同 时 我 们 还 能 利 
用 不 可 变 引 用 改变 Cel 内 部 的 值 。 但 实际 上 ， 这 个 类 型 是 完全 符合 “内 
存 安全 ”的 。 我 们 再 想 想 ， 为 什么 Rust 要 尽力 避免 aliass 和 mutation 同 时 
存在 ?因为 假如 我 们 同时 有 可 变 指 针 和 不 可 变 指针 指 问 同 一 块 内 存 ， 
有 可 能 出 现 通过 一 个 可 变 指针 修改 内 存 的 过 程 中 ， 数 据 结 构 处 于 被 破 
坏 状态 的 情况 下 ， 被 其 他 的 指针 观测 到 。Cell 类 型 是 不 会 出 现 这 样 的 
情况 的 。 因 为 Cell 类 型 把 数据 包 于 在 内 部 ， 用 户 无 法 获得 指 癌 内 部 状 
态 的 指针 ， 这 意味 着 每 次 方法 调用 都 是 执行 的 一 次 完整 的 数据 移动 操 
作 。 每 次 方法 调用 之 后 ，Cell 类 型 的 内 部 都 处 于 一 个 正确 的 状态 ， 我 
们 不 可 能 观察 到 数据 被 破坏 掉 的 状态 。 


多 个 共 译 指 针 指 癌 Cell 类 型 的 状态 就 类 似 图 15-1 所 示 的 这 样 ，Cell 
就 是 一 个 “ 壳 ”， 它 把 数据 严 产 实 实 地 包 右 在 里 面 ， 所 有 的 指针 只 能 指 
回 Cell， 不 能 直接 指 癌 数据 。 修 改 数据 只 能 通过 Cel 来 完成 ， 用 户 无 法 
创造 一 个 直接 指 回 数 据 的 指针 。 


共享 引用 


Cell 
(内 部 可 变性 ) 


共享 引用 


15-1 


我 们 来 仔细 观察 一 下 Cell 类 型 提供 的 公开 的 API， 束 能 理解 Cell 类 
型 设计 的 意义 了 。 下 面 是 Cell 类 型 提供 的 几 个 主要 的 成 员 方 法 : 


impl<T> Cell<T> { 
pub fn get_ mut(&mut self) -> &mut T { } 
pub fn set(&self, val: T) { } 
pub fn swap(&self, other: &Self) { } 
pub fn replace(&self, val: T) ->T{ } 


pub fn into_inner(self) ->TH{ } 
} 


impl<T:Copy> Cell<T> { 


pub fn get(&self) -> TH{ } 


-get_mut 方 法 可 以 从 &mut Cell<T> 类 型 制造 出 一 个 &mut T 型 指 
针 。 因 为 &mut 型 指针 具有 “独占 性 ”， 所 以 这 个 函数 保证 了 调用 前 ， 有 
且 仅 有 一 个 “可 写 ” 指 针 指向 Cell， 调 用 后 有 且 仅 有 一 个 “可 写 ” 指 针 指 加 
内 部 数据 。 它 不 存在 制造 多 个 引用 指向 内 部 数据 的 可 能 性 。 


set 方 法 可 以 修改 内 部 数据 。 它 是 把 内 部 数据 整个 欧 换 梭 ， 不 存在 
多 个 引用 指 癌 内 部 数据 的 可 能 性 。 


.Swap 方 法 也 是 修改 内 部 数据 。 跟 set 方 法 一 样 ， 也 是 把 内 部 数据 整 
体 蔡 换 掉 。 与 std: : mem: : swap 芳 数 的 区 别 在 于 ， 它 仪 要 求 & 引 
用 ， 不 要 求 &mnut 引 用 。 


Teplace 方 法 也 十 修改 内 部 数据 。 跟 set 方 法 一 样 ， 它 也 是 把 内 部 数 
据 整 体 蔡 换 ， 唯 一 的 区 别 是 ， 换 出 来 的 数据 作为 返回 值 返回 了 。 


"into_inner 方 法 相当 于 把 这 个 “ 膏 * 剥 挥 了 。 它 接受 的 是 Self 类 型 ， 
即 move 语 义 ， 原 来 的 Cell 类 型 的 变量 会 被 move 进 入 这 个 方法 ， 会 把 内 
部 数据 整体 返回 出 来 。 


get 方法 接受 的 是 &self 参 数 ， 返 回 的 是 T 类 型 ， 它 可 以 在 保留 之 前 
Cell 类 型 不 变 的 情况 下 返回 一 个 新 的 T 类 型 变量 ， 因 此 它 要 求 T: Copy 
2 。 每 次 调用 筷 的 时 候 ， 都 相当 于 把 内 部 数据 memcpy 了 一 份 返 回 出 


正 因 为 上 面 这 些 原 因 ， 我 们 可 以 看 到 ，Cell 类 型 虽然 违背 了 “共享 
不 可 变 ， 可 变 不 共享 ”的 规则 ， 但 它 并 不 会 造成 内 存 安 全 问题 。 它 
把 “共享 且 可 变 ” 的 行为 放 在 了 一 种 可 靠 、 可 控 、 可 信赖 的 方式 下 进 
行 。 它 的 API 是 经 过 仔细 设计 过 的 ， 绝 对 不 可 能 让 用 户 有 机 会 通过 
&Cetl<T> 获 得 &T 或 者 &mut T。 它 是 对 alias+mnutation 原 则 的 有 和 益 补 
充 ， 而 非 完全 颠覆 。 大 家 可 以 尝试 一 下 用 更 复杂 的 例子 (如 
Cell<Vec<i32>>) 试 试 ， 看 能 不 能 构造 出 内 存 不 安全 的 场景 。 


15.2 RefCell 


RefCell 是 另外 一 个 提供 了 内 部 可 变性 的 类 型 。 它 提供 的 方式 与 
Cell 类 型 有 点 不 一 样 。Cell 类 型 没 办 法 制造 出 直接 指向 内 部 数据 的 指 
针 ， 而 RefCell 可 以 。 我 们 来 看 一 下 它 的 API: 


impl<T: ?Sized> RefCell<T> { 
pub fn borrow(&self) -> Ref<T> { } 
pub fn try_borrow(&self) -> Result<Ref<T>, BorrowError> { } 
pub fn borrow mut(&self) -> RefMut<T> { } 
pub fn try_borrow mut(&self) -> Result<RefMUut<T>, BorrowMutError> { } 


pub fn get_ mut(&mut Self) -> &mut T { } 


get_mnut 方 法 与 Cell: : get_mut 一 样 ， 可 以 通过 &mut self 获 得 
&mut T， 这 个 过 程 是 安全 的 。 除 此 之 外 ，RefCell 最 主要 的 两 个 方法 就 
是 borrow 和 borrow_mut， 男 外 两 个 try_borrow 和 和 try_borrow_mut 只 是 它 


们 俩 的 镜像 版 ， 区 别 仅 在 于 错误 处 理 的 方式 不 同 。 
我 们 还 是 用 示例 来 演示 一 下 RefCell 怎 样 使 用 : 


use std::cell::RefCell; 


fn main() { 
let shared vec: RefCell<Vec<isize>> = RefCell: :new(vec![1, 2, 3]); 
let Shared1 = &shared_ vec,; 
let Shared2 = &shared1,; 


shared1.borrow_ mut().push(4); 
println!("{:?}", shared vec.borrow()); 


shared2.borrow mut().push(5); 
println!("{:?}", shared vec.borrow()); 


在 这 个 示例 中 ， 我 们 用 一 个 RefCell 包 了 一 个 Vec， 并 且 制 造 了 另 
外 两 个 共享 引用 指向 同一 个 RefCell。 这 时 ， 我 们 可 以 通过 任何 一 个 共 
译 引 用 调用 borrow_mut 方 法 ， 获 得 指 同 内 部 数据 的 “可 写 ” 指 针 ， 通 过 


这 个 指针 调用 了 push 方 法 ， 修 改 内 部 数据 。 同 时 ， 我 们 也 可 以 通过 调 
用 borrow 方 法 获得 指 同 内 部 数据 的 “只 读 ” 指 针 ， 读 取 Vec 里 面 的 值 。 


编译 ， 执 行 ， 结 果 为 ， 


$ ./test 
[1, 2, 3, 4] 
[1, 2, 3, 4, 5] 


这 里 有 一 个 小 问题 需要 跟 大 家 解释 一 下 : 在 函数 的 签名 中 ， 
borrow 方 法 和 borrow_mut 方 法 返回 的 并 不 是 &T 和 &mut T， 而 是 
Ref<T> 和 RefMut<T>。 它 们 实际 上 是 一 种 “ 吞 能 指针 ”， 完 全 可 以 当 作 
&T 和 &mut T 的 等 价 物 来 使 用 。 标 准 库 之 所 以 返回 这 样 的 类 型 ， 而 不 
是 原生 指针 类 型 ， 是 因为 它 需 要 这 个 指针 生命 周期 结束 的 时 候 做 点 事 
情 ， 需 要 目 定 义 类 型 包 闭 一 下 ， 加 上 目 定 义 析 构 函 数 。 至 于 包装 起 来 
和 它 的 原理 可 以 参考 下 一 草 “ 解 引 


那么 问题 来 了 : 如 果 borrow 和 borrow_mnut 这 两 个 方法 可 以 制造 出 
指 回 内 部 数据 的 只 读 、 可 读 写 指针 ， 那 么 它 是 怎么 保证 安全 性 的 呢 ? 
像 前 几 章 讲 的 那样 ， 如 果 同 时 构造 了 只 读 引 用 和 可 读 写 引用 指 癌 同 一 
个 Vec， 那 不 是 很 容易 职 构 造 出 晤 空 指针 么 ? 答案 是 ，RefCell 类 型 放 
弃 了 编译 阶段 的 aliastmutation 原 则 ， 但 依然 会 在 执行 阶段 保证 
alias+mnutation 原 则 。 示 例如 下 : 


use std::cell::RefCell,; 


fn main() { 
let shared vec: RefCell<Vec<isize>> = RefCell: :new(vec![1, 2, 3]); 
let Shared1 = &shared vec,; 
let shared2 = &shared1， 


let pi = shared1.borrow(); 
let p2 = &p1[0]; 


shared2.borrow mut().push(4); 
println!("{}", p2); 


上 面 这 个 示例 的 意图 是 :我 们 先 调 用 borrow 方 法 ， 并 制造 一 个 指 
回 数 组 第 一 个 元 系 的 指针 ， 接 痢 再 调用 borrow_mut 方 法 ， 修 改 这 个 数 


组 。 这 样 ， 就 构造 出 了 同时 出 现 aliass 和 mutation 的 场景 。 
编译 ， 通 过 。 执 行 ， 问 题 来 了 ， 程 序 出 现 了 panic: 


$ ./test 
thread 'main' panicked at 'already borrowed: BorrowMutError '， 


src\libcore\result.rs:860:4 
note: Run with ‘RUST_BACKTRACE=1. for a backtrace. 


出 现 panic 的 原因 是 ，RefCell 探 测 到 同时 出 现 了 alias 和 mnutation 的 
情况 ， 它 为 了 防止 更 糟糕 的 内 存 不 安全 状态 ， 和 直接 使 用 了 panic 来 拒绝 
程序 继续 执行 。 1 门 用 try_borrow 方 法 的 话 ， 束 会 发 现 返 回 值 是 
Result: : Er， 这 是 男 外 一 种 更 友好 的 错误 处 理 风 格 。 


那么 RefCell 是 怎么 探测 出 问题 的 呢 ? 原因 是 ，RefCell 内 部 有 一 
个 “借用 计数 器 *"， 调 用 borrow 方 法 的 时 候 ， 计 数 絮 里 面 的 “共享 引用 计 
数值 可 加 1。 “这 个 borow 结 全 的 时 候 ， 会 将 这 个 值 自动 城 1 (如 图 
15-2 所 示 ) 。 同样 ，borrow_mut 方 法 被 调用 的 时 候 ， 它 就 记录 一 下 当 
前 存在 “可 变 引 用 ”。 如 果 “ 共 享 引用 ”和 “可 变 引 用 ”同时 出 现 了 ， 就 会 


报错 。 


RefCell 
污 写 引用 计数 


borrow'() 


共 至 引用 
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从 原理 上 来 说 ，Rust 默 认 的 “借用 规则 检查 器 ”的 逻辑 非常 像 一 个 
在 编译 阶段 执行 的 * 读 写 锁 ” (read-write-locker) 。 如 果 同 时 存在 多 
个 “ 读 ” 的 锁 ， 是 没 问 题 的 ， 如 果 同 时 存在 “ 读 * 和 “ 写 ” 的 锁 ， 或 者 同时 
存在 多 个 “ 写 ” 的 锁 ， 就 会 发 生 错 误 。RefCell 类 型 并 没有 打破 这 个 规 
则 ， 只 不 过 ， 它 把 这 个 检查 逻辑 从 编译 阶段 移 到 了 执行 阶段 。RefCell 
让 我 们 可 以 通过 共享 引用 & 修 改 内 部 数据 ， 逃 过 编译 器 的 静态 检查 。 
但 是 它 依然 在 藤 殉 业 业 地 尽 可 能 保证 <* 内 存 安 全 ”。 我 们 需要 的 借用 指 
针 必 须 通 过 它 提 供 的 API borrow () borrow_mut () 来 获得 ， 它 实际 
上 是 在 执行 阶段 ， 在 内 部 维护 了 一 套 “ 读 写 锁 ” 检 查 机 制 。 一 旦 出 现 了 
多 个 “ 写 ” 或 者 同时 读 写 ， 就 会 在 运行 阶段 报错 ， 用 这 种 办 法 来 保证 写 
数据 时 候 的 执行 过 程 中 的 内 部 状态 不 会 被 观测 到 ， 任 何 时 候 ， 开 始 读 
或 者 开始 写 操作 开始 的 时 候 ， 共 享 的 变量 都 处 于 一 个 合法 状态 。 因 此 
在 执行 阶段 ，RefCell 是 有 少量 开销 的 ， 它 需要 维护 一 个 借用 计数 器 来 
保证 内 存 安全 。 


所 以 说 ， 我 们 一 定 不 要 过 于 滥用 RefCell 这 样 的 类 型 。 如 果 确 有 必 
要 使 用 ， 请 一 定 规划 好 动态 借用 出 来 的 指针 存活 时 间 ， 否 则 会 在 执行 
阶段 有 问题 。 


Cell 和 RefCell 用 得 最 多 的 场景 是 和 多 个 只 读 引 用 相配 合 。 比 如 ， 
多 个 & 引 用 或 者 Re 引用 指向 同一 个 变量 的 上 时候。 我 们 不 能 直接 通过 这 
些 只 读 引 用 修改 变量 ， 因 为 既然 存在 alias， 就 不 能 提供 mutation。 为 了 
让 存在 多 个 alias 共 译 的 变量 也 可 以 被 修改 ， 那 我 们 就 需要 使 用 内 部 可 
变性 。Rust 中 提供 了 只 读 引 用 的 类 型 有 &、Rc、Arc 等 指针 ， 它 们 可 以 
提供 alias。Rust 中 提供 了 内 部 可 变性 的 类 型 有 Cell、RefCell、Mutex、 
RwLock 以 及 Atomic* 系 列 类 型 等 。 这 两 类 类 型 经 常 需 要 配合 使 用 。 


如 果 你 需要 把 一 个 类 型 T 封 装 到 内 部 可 变性 类 型 中 去 ， 要 怎样 选 
择 Cell 和 RefCell 呢 ?原则 束 是 ， 如 果 你 只 需要 整体 性 地 存 入 、 取 出 T， 
el 。 如果 你 需要 有 个 可 读 写 指针 指向 这 个 T 修 改 它 ， 那 么 就 
] 先 RefCell 。 


15.3 UnsafeCell 


接 下 来 ， 我 们 来 分 析 CelyRefCell 的 实现 原理 。 我 们 先 来 考虑 两 个 
问题 ， 标 准 库 中 的 Cell 类 型 是 怎样 实现 的 ? 假如 让 我 们 目 己 来 实现 一 
裔 ， 是 否 可行 呢 ? 


模仿 标准 库 中 的 Cell 类 型 的 公开 方法 (只 考虑 最 简单 的 new 、 
get、set 这 三 个 方法 ) ， 我 们 先 来 一 个 最 简单 的 版 本 V1: 


struct CellVi<T> { 
value: T 
} 


impl<T> CellV1i<T> { 


fn new(v: T) -> Self where T: Copy { 
CellV1 { value: v} 


fn set(&self, v: T) { 
self.value = Vv; 


} 


fn get(&self) -> T where T: Copy { 
self .value 
} 
} 


这 个 版 本 是 一 个 new type 类 型 ， 内 部 包含 了 一 个 T 类 型 的 成 员 。 成 
员 方 法 对 类 型 T 都 有 恰当 的 约束 。 这 些 都 没 错 。 只 有 一 个 关键 问题 需 
要 注意 : 对 于 set 方 法 ， 直 接 这 样 写 是 肯定 行 不 通 的 ， 因 为 self 是 只 读 
引用 ， 我 们 不 可 能 直接 对 self.value 赋 值 。 而 且 ，Cell 类 型 最 有 用 的 地 方 
就 在 于 ， 它 可 以 通过 不 可 变 引 用 改变 内 部 的 值 。 那 么 这 个 问题 怎么 解 
决 呢 ? 可 以 使 用 unsafe 关 键 字 。 后 面 还 有 一 章 专门 讲解 unsafe， 此 处 只 
需 知道 ， 用 unsafe 包 起 来 的 代码 块 可 以 突破 编译 絮 的 一 些 限制 ， 做 一 
些 平常 不 能 做 的 事情 。 


以 下 是 修正 版 : 


Struct CellV2<T> { 
value: T 
} 


impl<T> CellV2<T> { 


fn new(v: T) -> Self where T: Copy { 
CellV2 { value: v} 


fn set(&self, v: T) where T: Copy { 


unsafe 区 
let p = &(self,value) as *const T as *mut T;// 此 处 实际 上 引入 了 未 定义 行为 
“p=v; 

} 


} 


fn get(&self) -> T where T: Copy { 
self.value 
} 


} 


在 使 用 unsafe 语 句 块 之 后 ， 这 段 代码 可 以 编译 通过 了 。 这 里 的 天 
键 是 ， 在 unsafe 代 码 中 ， 我 们 可 以 把 *const T 类 型 强制 转换 为 xmut 工 类 
型 。 这 是 初学 者 最 直观 的 解决 方案 ， 但 这 个 方案 是 错误 的 。 通 过 这 种 
方式 ， 我 们 获得 了 写 权 限 。 通 过 下 面 简 单 的 示例 可 以 看 到 ， 这 段 代码 
是 符合 我 们 的 预期 的 : 


fn main() { 
let C = CellV2::new(1 isize); 
let p = &c; 
p.set(2); 
println!("{}", c.get()); 


从 以 上 代码 可 以 看 出 ， 这 正 是 内 部 可 变性 类 型 的 特点 ， 即 通过 共 
译 指针 ， 修 改 了 内 部 的 值 。 


事情 就 这 么 简单 么 ”很 可 惜 ， 有 这 种 想法 的 人 都 过 于 naive 了 。 下 
面 这 个 示例 会 给 大 家 泌 一 倪 冷 水 : 


struct Table<'arg> { 
cell: CellV2<&'arg isize> 
} 


fn evil<'long,'short>(t: &Table<'long>, s: &'short isize) 
where 'long : 'short 


// The following assignment is not legal, but it escapes from lifetime 
checking 

let U: &Table<'short> = t; 

u.cell.set(s); 


} 


fn innocent<'long>(t: &Table<' long>) { 
let foo: isize = 1; 
evil(t, &foo); 

} 


fn main() { 
let local = 100; 
let table = Table { cell: CellV2::new(&local) }; 
innocent(&table); 
// reads ‘foo’, which has been destroyed 
let p = table.cell.get(); 
println!("{}", p); 


如 果 我 们 用 rustc temp.rs 编 译 debug 版 本 ， 可 以 看 到 执行 结果 为 1。 


如 果 我 们 用 rustc-O temp.rs 编 译 release 版 本 ， 可 以 看 到 执行 结果 为 
140733369053192 °。 


这 是 怎么 回 事 呢 ? 因 为 这 上段 代码 中 出 现 了 时 指针 。 我 们 来 分 析 一 
下 这 上 段 测 斌 代码。 在 这 上 段 测 斌 代码 中 ， 我 们 在 CellV2 类 型 里 面 保存 了 
一 个 引用 。main 函 数 调 用 了 innocent 畏 数 ， 继 而 又 调用 了 evil 函 数 。 这 
里 需要 特别 注意 的 是 : 在 evil 函 数 中 ， 我 们 调用 了 CellV2 类 型 的 set 方 
法 ， 改 变 了 它 里 面 存储 的 指针 。 修 改 后 的 指针 指向 的 谁 呢 ? 是 innocent 
函数 内 部 的 一 个 局 部 变量 。 最 后 在 main 函 数 中 ，innocent 函 数 返 回 后 ， 
再 把 这 个 CellV2 里 面 的 指针 拿 出 来 使 用 ， 束 得 到 了 一 个 野 指 针 。 


我 们 继续 从 生命 周期 的 角度 深入 分 析 ， 这 个 野 指 针 的 成 因 。 在 
main 函 数 的 开始 ，table.cell 变 量 保存 了 一 个 指 同 local 变 量 的 指针 。 这 
是 没 问题 的 ， 因 为 local 的 生命 周期 比 table 更 长 ，table.cell 指 回 它 肯定 不 
会 有 问题 。 有 问题 的 是 table.cell 在 evil 函 数 中 被 重新 赋值 。 这 个 赋值 导 
致 了 table.cell 保 存 了 一 个 指 同 局 部 调用 栈 上 的 变量 。 也 就 是 这 里 出 的 


问题 : 


// t: &Table<' Long> 

let U: &Table<'short> = t; 
// s: &'short isize 
u.cell.set(s); 


我 们 知道 ， 在 long: 'short 的 情况 下 ，&'long 类 型 的 指针 向 &'short 
类 型 赋值 是 没 问题 的 。 但 是 这 里 的 &Table<'long> 类 型 的 变量 赋值 给 


&Table<'short> 类 型 的 变量 合理 吗 ? 事实 证 明 ， 不 合理 。 证 明 如 下 。 我 
们 把 上 例 中 的 CellV2 类 型 改 用 标准 库 中 的 Cell 类 型 试 试 : 


type CellV2<T> = std::cell::Cell<T>; 


其 他 测试 代码 不 变 。 编 译 ， 提 示 错 误 为 : 


error[E0308]: mismatched types 
--> temp.rs:11:29 


| 

11 | let U: &Table<'short> = tt， 
| ^ lifetime mismatch 
| 


= note: expected type ‘&Table<'short>. 
= note: found type ‘&Table<'long>. 


果然 是 这 里 的 问题 。 使 用 我 们 目 己 写 的 CellV2 版 本 ， 这 段 测 试 代 
码 可 以 编译 通过 ， 并 制造 出 了 内 存 不 安全 。 使 用 标准 库 中 的 Cell 类 
型 ， 编 译 絮 成功 发 现 了 这 里 的 生命 周期 问题 ， 给 出 了 提示 。 


这 说 明了 CellV2 的 实现 依然 是 错误 的 。 虽 然 最 基本 的 测试 用 例 通 
过 了 ， 但 是 仙 到 复杂 的 测试 用 例 ， 它 还 是 不 够 “健壮 ”。 而 Rust 对 于 “内 
存 不 安全 ”问题 是 绝对 禁止 的 。 不 像 C[/C++， 在 Rust 语 言 中 ， 如 果 有 机 
会 让 用 户 在 不 用 unsafe 的 情况 下 制造 出 内 存 不 安全 ， 这 个 责任 不 是 由 
用 户 来 承担 ， 而 是 应 该 归 因 于 写 编译 器 或 者 写 库 的 人 。 在 Rust 中 ， 写 
库 的 人 不 需要 去 用 一 堆 文 档 来 向 用 户 保证 内 存 安 全 ， 而 是 必须 要 通过 
编译 错误 来 保证 。 这 个 示例 中 的 内 存 安全 问题 ， 不 能 归 因 于 测试 代码 
写 得 不 对 ， 因 为 在 测试 代码 中 没有 用 到 任何 unsafe 代 码 ， 用 户 是 正常 
使 用 而 已 。 这 个 问题 出 现 的 根源 还 是 CellV2 的 实现 有 了 问题， 具体 来 说 
就 是 那 段 unsafe 代 码 有 问题 。 按 照 Rust 的 代码 质量 标准 ，CellV2 版 本 是 
完全 无 法 接受 的 垃圾 代码 。 


那么 ， 这 个 bug 该 如 何 修正 呢 ? 为 什么 &klong 类 型 的 指针 可 以 问 
&'short 类 型 赋值 ， 而 &Cell<'long> 类 型 的 变量 不 能 同 &Cell<'short> 类 型 
的 变量 赋值 ? 因为 对 于 具有 内 部 可 变性 特点 的 Cell 类 型 而 言 ， 它 里 面 
本 来 是 要 保存 &'long 型 指针 的 ， 结 果 我 们 给 了 它 一 个 &'short 型 指针 ， 
那么 在 后 面 取出 指针 使 用 的 时 候 ， 这 个 指针 所 指向 的 内 容 已 经 销毁 ， 
瓯 出 现 了 野 指针 。 这 个 bug 的 解决 方案 是 ， 禁 止 具有 内 部 可 变性 的 类 


型 ， 针 对 生命 周期 参数 具有 “ 协 变 / 赣 变 ”特性 。 这 个 功能 是 通过 标准 库 
中 的 UnsafeCell 类 型 实现 的 : 


#[lang = "unsafe_cell"] 
#[stable(feature = "rust1", since = "1.0.0")] 
pub struct UnsafeCell<T: ?Sized> { 
value: TT, 
} 


请 注意 这 个 类 型 上 面 的 标记 #[lang=...]。 这 个 标记 意味 着 这 个 类 型 
是 个 特殊 拓 型 ， 定 被 编译 器 符 别 照顾 的 夫 型 。 这 个 类 型 的 说 明文 档 需 
要 特别 提示 读 一 下 : 


The core primitive for interior mutability in Rust. 


UnsafeCell<T> is a type that wraps some T and indicates unsafe interior 
operations on the wrapped type. Types with an UnsafeCell<T> field are considered 
to have an 'unsafe interior', The UnsafeCell<T> type is the only legal way to 
obtain aliasable data that is considered mutable. In general, transmuting an &T 
type into an &mut T is considered undefined behavior. 


Types like Cell<T> and RefCell<T> use this type to wrap their internal data. 


所 有 具有 内 部 可 变性 特点 的 类 型 都 必须 基于 UnsafeCell 来 实现 ， 否 
则 必然 出 现 各 种 问题 。 这 个 类 型 是 唯一 合法 的 将 &T 类 型 转 为 &mut T 
类 型 的 办 法 。 绝 对 不 允许 把 &T 直 接 转 换 为 &mutT 而 获得 可 变性 。 这 赴 
未 定义 行为 。 


大 家 可 以 自行 读 一 下 Cell 和 RefCell 的 源码 ， 可 以 发 现 ， 它 们 能 够 
正常 工作 的 关键 在 于 它们 都 是 基于 UnsafeCell 实 现 的 ， 而 UnsafeCell 本 
身 是 编译 器 特殊 照顾 的 类 型 。 所 以 我 们 说 “内 部 可 变性 ”这 个 概念 是 
Rust 语 言 提供 的 一 个 核心 概念 ， 而 不 是 通过 库 模 拟 出 来 的 。 


实际 上 ， 上 面 那 个 CellV2 示 例 也 正 说 明了 写 unsafe 代 码 的 困难 之 
处 。 许 多 时 候 ， 我 们 的 确 需 要 使 用 unsafe 代 码 来 完成 功能 ， 比 如 调用 C 
代码 写 出 来 的 库 等 。 但 是 却 有 可 能 一 不 小 心 违反 了 Rust 编 译 郝 的 规 
则 。 比 如 ， 你 没 读 过 上 面 这 段 文 档 的 话 ， 不 大 可 能 知道 简单 地 通过 裸 
指针 强制 类 型 转换 实现 &T 到 &mnut T 的 类 型 转换 是 错误 的 。 这 人 么 做 会 
在 编译 絮 的 生命 周期 静态 检查 过 程 中 制造 出 一 个 漏洞 ， 而 且 这 个 漏洞 
用 人 简单 的 测试 代码 测 不 出 来 ， 只 有 在 某 些 复杂 场景 下 才 会 导致 内 存 不 
安全 。Rust 代 码 中 写 unsafe 代 码 最 困难 的 地 方 其 实 就 在 这 样 的 细 市 中 ， 


有 些 人 在 没有 完全 理解 掌握 Rust 的 safe 代 人 码 和 unsafe 代 人 码 之 间 的 界限 的 
情况 下 ， 乱 写 unsafe 代 码 ， 这 是 不 负责 任 的 。 本 书后 面 还 会 有 一 章 专 
门 讲 解 unsafe 关 键 字 。 


第 16 草 ” 解 引 用 


“ 解 引 用 ”(Deref) 是 “ 取 引 用 ”(Ref) 的 反 操作 。 取 引用 ， 我 们 有 
&、&mnut 等 操作 符 ， 对 应 的 ， 解 引用 ， 我 们 有 * 操 作 符 ， 跟 C 语 言 定 一 
样 的 。 示 例如 下 : 


fn main() { 
let vi = 1; 
let p = &v1; // 取 引用 操作 
let v2 = *p; // 解 引用 操作 
println!("{} {}", v1, v2); 


} 


比如 说 ， 我 们 有 引用 类 型 p: &i32; ， 那 么 可 以 用 * 符 号 执行 解 引 
用 操作 。 上 例 中 ，v1 的 类 型 是 i32，p 的 类 型 是 &i32，*p 的 类 型 又 返回 
i32。 


16.1 目 定 义 解 引 用 


解 引 用 操作 可 以 被 目 定 义 。 方 法 是 ， 实 现 标准 库 中 的 std: 
ops: : Deref 或 者 std: : ops: : DerefMnut 文 两 个 trait。 


Deref 的 定义 如 下 所 示 。DerefMut 的 唯一 区 别 是 返回 的 是 &mut 型 引 
用 都 是 类 似 的 ， 因 此 不 过 多 介绍 了 。 


pub trait Deref { 

type Target: ?Sized; 

fn deref(&self) -> &Self::Target,; 
} 


pub trait DerefMut: Deref { 
fn deref_ mut(&mut self) -> &mut Self::Target; 
} 


这 个 trait 有 一 个 关联 类 型 Target， 代 表 解 引用 之 后 的 目标 类 型 。 
比如 ， 标 准 库 中 实现 了 String 向 str 的 解 引用 转换 : 


impl ops::Deref for String { 
type Target = str; 


#[inline] 


fn deref(&self) -> &str { 
unsafe { str::from utf8_unchecked(&self.vec) } 


请 大 家 注意 这 里 的 类 型 ，deref () 方法 返回 的 类 型 是 &Target， 而 
不 是 Target 。 


如 果 说 有 变量 s 的 类 型 为 String，*s 的 类 型 并 不 等 于 s.deref () 的 类 


(一 


开 ! 


= 


*6 的 类 型 实际 上 是 Target， 即 str。&*s 的 类 型 才 是 &str。 


s.deref () 的 类 型 为 &Target， 即 &str。 它们 的 关系 见 表 16-1。 


以 上 关系 有 点 绕 。 关 键 是 要 理解 ，*expr 的 类 型 是 Target， 而 deref 
方法 返回 的 类 型 却 是 &Target 。 


标准 库 中 有 许多 我 们 常见 的 类 型 实现 了 这 个 Deref 操 作 符 。 比 如 
Vec<T>、String、Box<T>、Rc<T>、Arc<T> 等 。 它 们 都 支持 “ 解 引 
用 ”操作 。 从 某 种 意义 上 来 说 ， 它 们 都 可 以 算 做 特种 形式 的 “指针 ”( 像 
胖 指 针 一 样 ， 是 融 有 额外 元 数据 的 指针 ， 只 是 元 数据 不 限制 在 usize 范 
围 内 了 ) 。 我 们 可 以 把 这 些 类 型 都 称 为 “智能 指针 ”。 


比如 我 们 可 以 这 样 理解 这 几 个 类 型 : 
-Box<T> 是 “指针 ”， 指 向 一 个 在 堆 上 分 配 的 对 象 ; 


“Vec<T> 是 “指针 ”， 指 向 一 组 同类 型 的 顺序 排列 的 堆 上 分 配 的 对 
象 ， 且 携 市 有 当前 缓存 空间 总 大 小 和 元 素 个 数 大 小 的 元 数据 ; 


String 是 “指针 ”， 指 回 的 是 一 个 堆 上 分 配 的 字 王 数组 ， 其 中 你 存 的 
内 容 是 合法 的 utf8 字 符 序 列 。 且 携 融 有 当前 缓存 空间 总 大 小 和 字符 串 实 
际 长 度 的 元 数据 。 


以 上 几 个 类 型 都 对 所 指 回 的 内 容 拥有 所 有 权 ， 管 理 痢 它们 所 指 回 
的 内 存 空 间 的 分 配 和 释放 。 


'Rc<T> 和 Arc<T> 也 走 某 种 形式 的 、 携 帝 了 额外 元 数据 的 “指针 ?”， 
它们 提供 的 是 一 种 “共享 ”的 所 有 权 ， 当 所 有 的 引用 计数 指针 都 销毁 之 
后 ， 它 们 所 指 同 的 内 存 空 间 才 会 被 释放 。 

目 定义 解 引 用 操作 符 可 以 让 用 户 目 行 定 义 各 种 各 样 的 “智能 指 
针 ”， 完 成 各 种 各 样 的 任务 。 再 配合 上 编译 局 的 “ 目 动 * 解 引用 机 制 ， 非 
单 有 用 。 下 面 我 们 讲解 什么 是 “ 目 动 解 引 用 ”。 


sg 
We 


16.2 ” 目 动 解 引 用 


Rust 提 供 的 “ 目 动 解 引 用 ”机 制 ， 是 在 某 些 场景 下 “ 隐 式 地 ”“ 目 动 
人 。 什么 是 目 动 解 引 用 呢 ? 下 面 用 一 个 示例 来 说 
朋 : 


fn main() { 
let s = "hello"; 
println!("length: {}", s.1len()); 
println!("length: {}", (&s).1len()); 
println!("length: {}", (&&&&8888888888S).1en()); 


编译 ， 成 功 。 查 文档 我 们 可 以 知道 ，len () 这 个 方法 的 签名 是 : 
fn len(&self) -> usize 


它 接受 的 receiver 参 数 是 &str， 因 此 我 们 可 以 用 UFCS 语 法 调用 : 


println!("length: {}", str::len(&s)); 


但 是 ， 如 果 我 们 使 用 &&r&&r&&&r&&r&rstr 类 型 来 调用 成 员 方法 ， 
也 是 可 以 的 。 原 因 就 是 ，Rust 编 译 器 帮 有 我 们 做 了 隐 式 的 deref 调 用 ， 当 
它 找 不 到 这 个 成 员 方 法 的 时 候 ， 会 自动 尝试 使 用 deref 方 法 后 再 找 该 方 
法 ,一 直 循 环 下 去 。 


编译 絮 在 &&&str 类 型 里 面 找 不 到 ]en 方 法 ， 演 试 将 它 deref， 变 成 
&&str 类 型 后 再 寻找 len 方 法 ， 还 是 没 找 到 ， 继 续 deref， 变 成 &str， 现 
在 找到 len 方 法 了 ， 于 是 就 调用 这 个 方法 。 


自动 deref 的 规则 是 ， 如 果 类 型 T 可 以 解 引 用 为 U， 即 TT: 
Deref<U>， 则 &T 可 以 转 为 &U 。 


16.3 目 动 解 引 用 的 用 处 
用 Re 这 个 “智能 指针 "举例 。Rc 实 现 了 Deref: 


impl<T: ?Sized> Deref for Rc<T> { 
type Target = T; 
#[inline(always)] 
fn deref(&self) -> &T { 
&self.inner().value 
} 


} 


它 的 Target 类 型 是 它 的 泛 型 参数 T。 这 么 设计 有 什么 好 处 呢 ? 我 们 
看 下 面 的 用 法 : 


USe std::rc::Rc,; 

fn main() { 
let s = Rc::new(String::from("hello")); 
println!("{:?}", Ss.bytes()); 

} 


我 们 创建 了 一 个 指向 String 类 型 的 Rc 指针 ， 并 调用 了 bytes () 方 
法 。 这 里 十 不 是 有 点 琳 怪 ? 


这 里 的 机 制 是 这 样 的 ，Rc 类 型 本 身 并 没有 bytes () 方法 ， 所 以 编 
译 器 会 尝试 自动 deref， 试 斌 s.deref () .bytes () 。 


String 类 型 其 实 也 没有 bytes () 方法 ， 但 是 String 可 以 继续 deref， 
于 是 再 试 试 s.deref () .deref () .bytes () 。 


这 次 在 st 类 型 中 找到 了 bytes () 方法 ， 于 是 编译 通过 。 


我 们 实际 上 通过 Rec 类 型 的 变量 调用 了 str 类 型 的 方法 ， 让 这 个 千 能 
指针 透明 。 这 驳 是 目 动 Deref 的 意义 。 


实际 上 以 下 写法 在 编译 器 看 起 来 是 一 样 的 : 


use std::rc::Rc,; 
Use std::ops::Deref; 


fn main() { 
let s = Rc::new(String::from("hello")); 


println!("length: {}", s.1len()); 
println!("length: {}", s.deref().1len()); 
println!("length: {}", s.deref().deref().1len()); 


println!("length: {}", (*s).1len()); 
println!("length: {}", (&*s).1len()); 
println!("length: {}", (&**s).1len()); 


这 就 是 为 什么 String 需 要 实现 Deref trait， 是 为 了 让 &String 类 型 的 
量 可 以 在 必要 的 时 候 自动 转换 为 &str 类 型 。 所 以 String 类 型 的 变量 可 
公理 技 交 用 str 类 型 的 方法 。 比 如 : 


let s = String::from("hello"); 
let len = s.bytes(); 


虽然 s 的 类 型 是 String， 但 它 在 调用 bytes () 方法 的 上 时候， 编译 器 
会 自动 查找 并 转换 为 s.deref () .bytes () 调用 。 所 以 String 类 型 的 变量 
就 可 以 直接 调用 str 类 型 的 方法 了 。 


同 理 : Vec<T> 类 型 也 实现 了 Deref trait， 目 标 类 型 是 [T]， 
&Vec<T> 类 型 的 变量 束 可 以 在 必要 的 时 候 自 动 转换 为 &[T] 数 组 切 厂 类 
型 ，Rc<T> 类 型 也 实现 了 Deref trait， 目 标 类 型 是 T，Rc<T> 类 型 的 变量 
承 可 以 直接 调用 T 类 型 的 方法 。 


注意 : &* 两 个 操作 符 连 写 跟 分 开 写 是 不 同 的 舍 义 。 以 下 两 种 写法 
征 不 同 的 : 


fn joint() Lt 
let s = Boxs :New(String: :new( )); 
let p = &*s 
printini("{} {}", p, s); 


fn separate() { 
let s = Box::new(String::new()); 
let tmp = 
let p = &tmp 
printin1("{} {}", p, s); 


fn main() { 
joint(); 
separate( ); 


fnjoint () 是 可 以 直接 编译 通过 的 ， 而 fn separate () 是 不 能 编译 
通过 的 。 因 为 编译 器 很 聪明 ， 它 看 到 &* 这 两 个 操作 连 在 一 起 的 时 候 ， 
会 直接 把 &*s 表 达 式 理解 为 s.deref () ， 这 时 候 p 只 是 s 的 一 个 借用 而 
已 。 而 如 果 把 这 两 个 操作 分 开 写 ， 会 先 执行 *s 把 内 部 的 数据 move 出 
人 这 时 候 s 已 经 被 移 走 了 ， 生 命 周 期 已 经 


同样 的 ，let p=&{*s}; 这 种 写法 也 编译 不 过 。 这 个 化 括号 的 存在 
创建 了 一 个 临时 的 代码 块 ， 在 这 个 临时 代码 块 内 部 先 执 行 解 引 用 ， 同 


样 是 move 语 义 。 


从 这 里 我 们 也 可 以 看 到 ， 默 认 的 “ 取 引 用 ”`“ 解 引用 ”操作 是 互补 
抵 请 的 关系 ， 互 为 园 运 算 。 但 是 ， 在 Rust 中 ， 只 人 允许 目 定义 “ 解 引 
用 ”， 不 允许 目 定义 “ 取 引 用 ”。 如 有 果 类 型 有 目 定义 “ 解 引 用 ”， 那 么 对 它 
执行 “ 解 引 用 ”和 “ 取 引 用 ” 束 不 再 是 互 促 抵 消 的 结果 了 。 先 & 后 * 以 及 先 
* 后 & 的 线条 坪 不 同 的 。 


16.4 有 时 候 需 要 手动 处 理 


如 采 智 能 指针 中 的 方法 与 它 内 部 成 员 的 方法 冲突 了 怎么 办 呢 ? 编 
译 絮 会 优先 调用 当前 最 匹配 的 类 型 ， 而 不 会 执行 目 动 deref， 在 这 种 情 
况 下 ， 我 们 束 只 能 手动 deref 来 表达 我 们 的 需求 了 。 


比如 说 ，Rc 类 型 和 String 类 型 都 有 clone 方 法 ， 但 是 它们 执行 的 任 
务 不 同 。Rc: : clone () 做 的 是 把 引用 计数 指针 复制 一 份 ， 把 引用 计 
数 加 1。String: : clone () 做 的 是 把 字符 串 深 复制 一 份 。 示 例如 下 : 


USe std::rc::Rc; 
use std::ops::Deref; 
fn type_of(_: ()) {} 


fn main() { 
let s = Rc::new(Rc: :new(String::from("hello"))); 


let si = s.clone(); /7 (1) 
//type_of(s1); 

let psi = (*s).clone(); // (2) 
//type_of(ps1); 

let pps1 = (**s).clone(); // (3) 
//type_of(pps1); 


在 以 上 的 代码 中 ， 位 置 (1) 处 s1 的 类 型 为 Rec<Rc<String>>， 位 置 
(2) 处 ps1 的 类 型 为 Rc<String>， 位 置 (3) 处 pps1 的 类 型 为 String。 


一 般 情 况 下 ， 在 函数 调用 的 时 候 ， 编 译 器 会 帮 我 们 壬 试 目 动 解 引 
用 。 但 在 某 些 情况 下 ， 编 译 亏 不 会 为 我 们 目 动 插入 目 动 解 引 用 的 代 
码 。 以 String 和 &str 类 型 为 例 ， 在 match 表 达 式 中 : 


fn main() { 
let s = String::new(); 
{ 


这 上段 代码 编译 会 发 生 错误 ， 错 误 信息 为 : 


mismatched types : 
expected ‘&collections::string::String, 
found ‘&'static str. 


match 后 面 的 变量 类 型 是 &String， 匹 配 分 文 的 变量 类 型 为 &'static 
str， 这 种 情况 下 就 需要 我 们 手动 完成 类 型 转换 了 。 手 动 将 &String 类 型 
转换 为 &str 类 型 的 办 法 如 下 。 


1) match s.deref () 。 这 个 方法 通过 主动 调用 deref () 方法 达到 
类 型 转换 的 目的 。 此 时 我 们 需要 引入 Deref trait 方 可 通过 编译 ， 即 加 上 
代码 use std: : ops: : Deref; 。 


2) match &s*s。 我 们 可 以 通过 *s 运 算 符 ， 也 可 以 强制 调用 deref 
() 方法， 与 上 面 的 做 法 一 样 。 

3) match s.as_ref () 。 这 个 方法 调用 的 是 标准 库 中 的 std: : 
convert: : AsRef 方 法 ， 这 个 trait 存 在 于 prelude 中 ， 无 须 手 工 引 入 即 可 
使 用 。 

4) match s.borrow () 。 这 个 方法 调用 的 是 标准 库 中 的 std: : 
borrow: : Borrow 方 法 。 要 使 用 它 ， 需 要 加 上 代码 use std: : 


borrow: : Borrow: 


5) match &s[..]。 这 个 方案 也 是 可 以 的 ， 这 里 利用 了 String 重 载 的 
Index 操 作 。 


16.5 ”和 鹤 能 指针 


Rnust 语 言 提 供 了 所 有 权 、 默 认 move 语 义 、 借 用 、 生 命 周期 、 内 部 
可 变性 等 基础 概念 。 但 这 些 并 不 是 Rust 全 部 的 内 存 管理 方式 ， 在 这 些 
概念 的 基础 上 ， 我 们 还 能 继续 抽象 、 封 逆 更 多 的 内 存 管理 方式 ， 而 且 
保证 内 存 安 全 。 


16.5.1 引用 计数 


到 目前 为 目 ， 我 们 接触 到 的 示例 中 都 是 一 块 内 存 总 是 只 有 唯一 的 
一 个 所 有 者 。 当 这 个 变量 绑 定 目 且 消亡 的 时 候 ， 这 块 内 存 融会 被 释 
放 。 引 用 计数 智能 指针 给 我 们 提供 了 另外 一 种 选择 : 一 块 不 可 变 内 存 
可 以 有 多 个 所 有 者 ， 当 所 有 的 所 有 者 消亡 后 ， 这 块 内 存 才 会 被 释放 。 


Rust 中 提供 的 引用 计数 指针 有 std: : rc: : Rc<T> 类 型 和 std: : 
sync: : Arc<T> 类 型 。Rc 类 型 和 Arc 类 型 的 主要 区 别 是 : Rc 类 型 的 引 
用 计数 是 普通 整数 操作 ， 只 能 用 在 单线 程 中 ; Arc 类 型 的 引用 计数 是 原 
子 操作 ， 可 以 用 在 多 线程 中 。 这 一 点 是 通过 编译 絮 静 人 态 检查 你 证 的 。 
Arc 类 型 的 讲解 可 以 参见 第 四 部 分 相关 章节 ， 本 章 主要 关注 Rc 类 型 。 


首先 我 们 用 示例 展示 Rc 智 能 指针 的 用 法 : 


USe std::rc::Rc; 
struct SharedValue { 
Value : 1i32 

} 
fn main() { 


let shared value : Rc<SharedValue> = Rc::new(SharedValue { value : 42 }); 


let owner1 = shared value.clone(); 
let owner2 = shared value.clone(); 


println!i("value : {} {}", owneri.value, owner2.value); 
println!("address : {:p} {:p}", &owneri.value, &owner2.value); 


$ ./test 
value : 42 42 
address : 0x13958abdf20 0x13958abdf20 


这 说 明 ，ownerl owner2 里 面包 含 的 数据 不 仅 值 是 相同 的 ， 而 且 地 
址 也 是 相同 的 。 这 正 是 Rc 的 意义 所 在 。 


从 示例 中 可 以 看 到 ，Rc 指 针 的 创建 是 调用 Rc: : new 静 态 函 数 ， 
与 Box 类 型 一 致 《将 来 会 允许 使 用 box 关 键 字 创建 ) 。 如 果 要 创建 指向 
同样 内 存 区 域 的 多 个 Rc 指 针 ， 需 要 显 式 调用 Clone 函数 。 请 注意 ，Rc 指 
针 是 没有 实现 Copy trait 的 。 如 果 使 用 直接 赋值 方式 ， 会 执行 move 语 
义 ， 导 致 前 一 个 指针 失效 ， 后 一 个 指针 开始 起 作用 ， 而 且 引 用 计数 值 
不 变 。 如 果 需 要 创造 新 的 Rc 指 针 ， 必 须 手 工 调用 clone () 范 数 ， 此 时 
引用 计数 值 才 会 加 1。 当 某 个 Rc 指 针 失 效 ， 会 导致 引用 计数 值 减 1。 当 
引用 计数 值 减 到 0 的 时 候 ， 共 享 内 存 空 间 才 会 被 释 放 。 


这 没有 违反 我 们 前 面 讲 的 “内 存 安全 "原则 ， 它 内 部 包含 的 数据 
是 “不 可 变 的 "， 每 个 Rc 指针 对 它 指向 的 内 部 数据 只 有 读 功 能 ， 和 共有 至 
引用 & 一致， 因此 ， 它 是 安全 的 。 区 别 在 于 ， 共 剖 引 用 对 数据 完全 没 
有 所 有 权 ， 不 负责 内 存 的 释放 ，Rc 指 针 会 在 引用 计数 值 减 到 0 的 时 候 
释放 内 存 。 Rust 里 面 的 Rc<T> 类 型 类 似 于 C++ 里 面 的 shared_ptr<const 
T> 类 型 ， 且 强制 不 可 为 空 。 


从 示例 中 我 们 还 可 以 看 到 ， 使 用 Rc 访问 被 包 含 的 内 部 成 员 时 ， 可 
以 直接 使 用 小 数 点 语法 来 进行 ， 与 T &T Box<T> 类 型 的 使 用 方法 一 
样 。 原 因 我 们 在 前 面 已 经 讲 过 了 ， 这 是 因为 编译 需 帮 我 们 做 了 目 动 解 
引用 。 我 们 查 一 下 Re 的 源码 就 可 以 知道 : 


impl<T: ?Sized> Deref for Rc<T> { 
type Target = T; 
#[inline(always)] 
fn deref(&self) -> &T { 
&self.inner().value 
} 


} 


可 见 ，Rc 类 型 重 载 了 “ 解 引 用 ”运算 符 ， 而 且 恰 好 Target 类 型 指定 的 
是 T。 这 就 意味 着 编译 器 可 以 将 Rc<T> 类 型 在 必要 的 时 候 上 自动 转换 为 


&T 类 型 ， 于 是 它 就 可 以 访问 T 的 成 员 变量 ， 调 用 T 的 成 员 方法 了 。 
此 ， 它 可 以 被 归 类 为 “智能 指针 ”。 


下 面 我 们 继续 分 析 Rc 类 型 的 实现 原理 。 它 的 源 代 码 在 
src/liballoc/rc.rs 中 ，Rc 类 型 的 定义 如 下 所 示 : 


pub struct Rc<T: ?Sized> { 
_ptr: Shared<RcBox<T>>, 


其 中 RcBox 是 这 样 定义 的 : 


struct RcBox<T: ?Sized> { 
strong: Cell<usize>, 
weak: Cell<usize>, 
value: TT, 


} 


其 中 Shared 类 型 我 们 暂时 可 以 不 用 管 它 ， 当 它 是 一 个 普通 指针 吏 
好 。 目 前 它 还 没有 稳定 ， 后 续 可 能 设计 上 还 会 有 变化 ， 因 此 本 书 就 不 
对 它 深 究 了 。 


同时 ， 它 实现 了 Clone 和 Drop 这 两 个 trait。 在 clone 方 法 中 ， 它 没有 
对 它 内 部 的 数据 实行 深 复 制 ， 而 是 将 强 引 用 计数 值 加 1， 如 下 所 示 : 


impl<T: ?Sized> Clone for Rc<T> { 


#[inline] 

fn clone(&self) -> Rc<T> { 
Self,inc_strong() ， 
Rc { ptr: self.ptr } 


} 


fn inc_strong(&self) { 
self,inner().strong.set(self,.strong().checked_add(1) 
.UNwrap_or_else(|| unsafe { abort() })); 


} 


在 drop 方 法 中 ， 也 没有 直接 把 内 部 数据 释放 斥 ， 而 征 将 强 引用 计 
数值 减 1， 当 强 引 用 计数 值 减 到 0 的 时 候 ， 才 会 析 构 掉 共 至 的 那 块 数 


据 。 当 弱 引 用 计数 值 也 减 为 0 的 时 候 ， 才 说 明 没 有 任何 RoWeak 指 针 指 
问 这 块 内 存 ， 它 占用 的 内 存 才 会 被 彻底 释放 。 如 下 所 不: 


unsafe impl<#[may_dangle] T: ?Sized> Drop for Rc<T> { 
fn drop(&mut self) { 
unsafe 区 
let ptr = self.ptr.as_ptr(); 


self.dec_strong(); 

If self.strong() == 0 { 
// destroy the contained object 
ptr::drop_in_place(self.ptr.as_mut()); 


// remove the implicit "strong weak" pointer now that we've 
// destroyed the contents. 
self.dec_ weak( ); 


If self.weak() == 0 { 
Heap.dealloc(ptr as *mut u8, Layout::for_value(&*ptr)); 
} 


} 
} 
} 
} 


从 上 面 代码 中 我 们 可 以 看 到 ，Rc 智 能 指针 所 指向 的 数据 ， 内 部 包 
舍 了 强 引 用 和 弱 引 用 的 计数 值 。 这 两 个 计数 值 都 是 用 Cell 包 起 来 的 。 
为 什么 这 两 个 数字 一 定 要 用 Cell 包 起 来 呢 ? 


我 们 假设 ， 如 果 不 用 Cell<usize> ， 而 是 直接 用 usize 的 话 ， 在 执行 
clone 方 法 时 会 出 现 什 么 情况 。 


fn clone(&self) -> Rc<T> {} 


大 家 需要 注意 的 是 ， 这 个 self 的 类 型 是 &Self， 不 是 &mut Self。 但 
我 们 同时 还 需要 使 用 这 个 共享 引用 self 来 修改 引用 计数 的 值 。 


所 以 这 个 成 员 必 须 是 具有 内 部 可 变性 的 。 反 之 ， 如 果 它 们 是 普通 
的 整数 ， 那 么 我 们 就 要 求 使 用 &mut Self 类 型 来 调用 Clone 方法， 然而 一 
般 情 况 下 ， 我 们 都 会 需要 多 个 Rc 指针 指 癌 同一 块 内 存 区 域 ， 引 用 计数 
值 是 共享 的 。 如 果 存 在 多 个 &mnut 型 指针 指向 引用 计数 值 的 话 ， 则 违反 
了 Rust 内 存 安 全 的 规则 。 


因此 ，Rc 知 能 指针 的 实现 ， 必 须 使 用 “内 部 可 变性 ”功能 。Cell 类 
型 提供 了 一 种 类 似 C++ 的 mutable 关 键 字 的 能 力 ， 使 我 们 可 以 通过 不 可 
变 指针 修改 复合 数据 类 型 内 部 的 茶 一 个 成 员 变 量 。 


所 以 ， 我 们 可 以 总 结 出 最 适合 使 用 * 内 部 可 变性 ”的 场景 是 : 当 逮 

辑 上 不 可 变 的 方法 的 实现 细 市 义 要 求 某 部 分 成 员 变 量具 有 可 变性 的 时 

py 以 使 用 “内 部 可 变性 ”。Rc 内 部 的 引用 计数 变量 就 是 绝 佳 的 
| o 


多 个 Rc 指针 指向 的 共 至 内 存 区 域 如 果 需 要 修改 的 话 ， 也 必须 用 内 
部 可 变性 。 如 在 下 面 的 例子 中 ， 如 采 我 们 需要 多 个 Rc 指针 指向 一 个 
Vec， 而 且 具 备 修改 权限 的 话 ， 那 我 们 必须 用 RefCell 把 Vec 包 起 来 : 


use std::rc::Rc,; 
use std::cell::RefCell,; 


fn main() { 
let shared vec: Rc<RefCell<Vec<isize>>> = Rc::new(RefCell::new(vec![1, 2, 


3])); 
let Shared1 = shared_vec.clone(); 
let Shared2 = sharedi1.clone(); 


shared1.borrow mut().push(4); 
println!("{:?}", shared_ vec.borrow()); 


shared2.borrow_ mut().push(5); 
println!("{:?}", shared_ vec.borrow()); 


16.5.2 Cow 


在 C++ 语 境 中 ，Cow 代 表 的 是 Copy-On-Write， 即 “ 写 时 复制 技 
术 ”。 它 是 一 种 高 效 的 资源 管理 手段 。 假 设 我 们 有 一 份 比 较 昂 贵 的 资 
源 ， 当 我 们 需要 复制 的 时 候 ， 我 们 可 以 采用 “ 浅 复制 * 的 方式 ， 而 不 需 
要 重新 克隆 一 份 新 的 资源 。 而 如 果 要 修改 复制 之 后 的 值 ， 这 时 候 再 执 
行 深 复制 ， 在 此 基础 上 修改 。 因 此 ， 它 的 优点 是 把 克隆 这 个 操作 推迟 
到 真正 需要 “复制 并 写 操作 ”的 时 候 发 生 。 


在 Rust 语 境 中 ， 因 为 Copy 和 Clone 有 比较 明确 的 语义 区 分 ， 一 般 把 
Cow 和 解释 为 Clone-On-Write。 它 对 指 癌 的 数据 可 能 “拥有 所 有 权 ”， 或 者 
可 能 “不 拥有 所 有 权 ”。 


当 它 只 需要 对 所 指 疝 的 数据 进行 只 读 访 问 的 时 候 ， 它 整 只 是 一 
上 用 指针 当 它 需要 写 数据 功能 时 ， 它 会 先 分 配 内 存 ， 执 和 了 和 吕 
作 ， 再 对 目 己 拥有 所 有 权 的 内 存 进 行 写 入 操作 。Cow 在 标准 库 中 是 一 


个 enum: 


pub enum Cow<'a, B: ?Sized + 'a> where B: ToOwned { 
/// Borrowed data. 
Borrowed(&'a B), 


/// Owned data. 
Owned(<B as ToOwned>: :Owned) 


它 可 以 是 Borrowed 或 者 Owned 两 种 状态 。 如 果 是 Borrowed 状 态 ， 
可 以 通过 调用 to_mut 另 数 获取 所 有 权 。 在 这 个 过 程 中 ， 它 实际 上 会 分 
配 一 块 新 的 内 存 ， 并 将 原来 Borrowed 状 态 的 数据 通过 调用 to_owned 
() 方法 构造 出 一 个 新 的 拥有 所 有 权 的 对 象 ， 然 后 对 这 块 拥 有 所 有 权 
的 内 存 执行 操作 。 


Cow 类 型 最 常见 的 是 跟 字 符 浊 配 合 使 用 : 


use Std::borrow: :Cow; 
fn remove_spaces<'a>(input: &'a str) -> Cow<'a, str> { 
If input.contains(' ') { 
let mut buf = String::with_capacity(input.1len()); 
for c in input,chars() { 


if c != " 
buf .push(c); 


} 


return Cow: :Owned(buf); 


} 
return Cow: :Borrowed(input); 
fn main() { 
let si = "no_spaces_in_string",; 


let result1 = remove_spaces(s1); 


let s2 = "spaces in string"; 
let result2 = remove_spaces(s2); 


println!("{}\n{}", result1i, result2); 


在 这 个 示例 中 ， 我 们 使 用 Cow 类 型 最 主要 的 目的 是 优化 执行 效 
率 。remove_spaces 函 数 的 输入 参数 是 &str 类 型 。 如 果 输 入 的 参数 本 来 
束 不 包含 空格 ， 那 么 我 们 最 好 是 直接 返回 参数 本 号 ， 无 须 分 配 新 的 内 
存 ; 如 果 和 输入 参数 包含 空格 ， 我 们 就 只 能 在 函数 体内 部 创建 一 个 新 的 
String 对 象 ， 用 于 存储 去 除 抒 空格 的 结果 ， 然 后 再 返回 去 。 


这 样 一 来 ， 就 产生 了 一 个 小 矛盾 ， 这 个 函数 的 返回 值 类 型 用 &str 
类 型 和 String 类 型 都 不 大 合适 。 


-如果 返 回 类 型 指定 为 &str 类 型 ， 那 么 需要 新 分 配 内 存 的 时 候 ， 会 
出 现 生命 周期 编译 错误 。 因 为 轴 数 内 部 新 分 配 的 字符 训 的 引用 不 能 在 
函数 调用 结束 后 继续 存在 。 


如 有 条 返 回 类 型 指定 为 String 类 型 ， 那 么 对 于 那 种 不 需要 对 输入 参 
数 做 修改 的 情况 ， 有 一 些 性 能 损失 。 因 为 输入 参数 &str 类 型 转 为 String 
类 型 需要 分 配 新 的 内 存 空间 并 执行 复制 ， 性 能 开销 较 大 。 


这 种 时 候 使 用 Cow 类 型 就 古 不 二 之 选 。 既 能 满足 编译 器 的 生命 周 
期 要 求 ， 也 人 避免 了 无 请 的 数据 复制 。Cow 类 型 ， 就 是 优秀 的 “ 零 性 能 损 
失 抽象 ”的 设计 范例 。 


C++implementations obey the zero-overhead principle: What you 
don’t use, you don’t pay for.And further: What you do use, you couldn’t 
hand code any better. 


Stroustrup 


由 于 Rust 中 有 这 套 所 有 权 、 生 命 周期 的 基础 ， 在 Rust 中 使 用 Cow 
这 种 类 型 是 完全 没有 风险 的 ， 任 何 可 能 的 内 存 安全 问题 ， 编 译 需 都 可 
以 帮 有 我 们 查 出 来 。 所 以 ， 有 些 时 候 ， 目 由 和 不 目 由 是 可 以 相互 转化 
的 ， 语 法 方面 的 不 目 由 ， 反 而 可 能 造 束 抽象 水 平 的 更 目 由 。 


Cow 类 型 还 实现 了 Deref trait， 所 以 当 我 们 需要 调用 类 型 T 的 成 员 
函数 的 时 候 ， 可 以 直接 调用 ， 完 全 无 须 考 虑 后 面具 体 是 “借用 指针 ”还 
人 所 有 权 的 指针 ?”。 所 以 我 们 也 可 以 把 它 当 成 是 一 种 “智能 指 


16.6 小结 


Rust 中 允许 一 部 分 运算 符 可 以 由 用 户 目 定义 行为 ， 即 “操作 符 重 
载 "*。 其 中 “ 解 引用 ”是 一 个 非常 重要 的 操作 符 ， 它 允许 重 载 。 


而 需要 提 桓 大 家 注意 的 是 ,“ 取 3 引用 ”操作 符 ， 如 &&、&mut， 是 不 
允许 重 载 的 。 因 此 ,“ 取 引用 ”和 * 解 引用 ?并非 对 称 互 补 关 系 。*&T 的 
类 型 一 定 是 T， 而 &*T 的 类 型 未 必 束 是 T。 

更 重要 的 是 ， 读 者 需要 理解 ， 在 某 些 情况 下 ， 编 译 器 帮 有 我 们 插入 
了 目 动 deref 的 调用 ， 简 化 代码 。 

在 Deref 的 基础 上 ， 我 们 可 以 封装 出 一 种 目 定 义 类 型 ， 它 可 以 直接 
ee 我 们 可 以 把 这 种 类 型 称 为 智能 指 


第 17 章 ”泄漏 


熟悉 C++ 的 朋友 应 该 知道 ， 在 C++ 中 ， 如 果 引 用 计数 智能 指针 出 
现 了 循环 引用 ， 束 会 导致 内 存 泄漏 。 而 Rust 中 也 一 样 存在 引用 计数 智 
能 指针 Rc， 那 么 Rust 中 是 否 可 能 制造 出 内 存 泄漏 呢 ? 


ee 和 看 看 如 何 才能 构造 一 个 内 存 泄 漏 
例子。 


17.1 内 存 泄 漏 


首先 ， 我 们 设计 一 个 Node 类 型 ， 它 里 面包 含 一 个 指针 ， 可 以 指 同 
其 他 的 Node 实 例 : 


struct Node 
next : Box<Node> 


接 下 来 我 们 答 试 一 下 创建 两 个 实例 ， 将 它们 首尾 相连 : 


fn main() { 
Jet node1 = Node { next : Box::new(...) } 
} 


到 这 里 写 不 下 去 了 ，Rust 中 要 求 ，Box 指 针 必 须 被 合理 初始 化 ， 而 
初始 化 Box 的 时 候 又 必须 先 传 入 一 个 Node 实 例 ， 这 个 Node 的 实例 又 要 
求 创建 一 个 Box 指 针 。 这 成 了 “ 鸡 生 和 蛋 蛋 生 鸡 ”的 无 限 循 环 。 


要 打破 这 个 循环 ， 我 们 需要 使 用 “可 空 的 指针 ”。 在 初始 化 Node 的 
时 候 ， 指 针 应 该 是 “ 空 ” 状 态 ， 后 面 再 把 它们 连接 起 来 。 我 们 把 代码 改 
进 ， 为 了 能 修改 node 的 值 ， 还 需要 使 用 maut: 


struct Node 
next : Option<Box<Node>> 


fn main() { 
let mut node1 = Box::new (Node { next : None }); 
let mut node2 = Box::new (Node { next : None }); 


node1l.next = Some(node2); 
node2.next = Some(node1); 


编译 ， 发 生 错 误 : “error: use of moved value: ‘node2'”。 


从 编译 信息 中 可 以 看 到 ， 在 nodel.next=Some (node2) ; 这 条 语 
句 中 发 生 了 move 语 义 ， 从 此 句 往 后 ，node2 变 量 的 生命 周期 已 经 结束 


了 。 因 此 后 面 一 句 中 使 用 node2 的 时 候 发 生 了 错误 。 那 我 们 需要 继续 改 
进 ， 不 使 用 node2， 换 而 使 用 nodel.next， 代 码 改 成 下 面 这 样 : 


fn main() { 
let mut node1 = Box::new (Node { next : None }); 
let mut node2 = Box::new (Node { next : None }); 


node1.next = Some(node2); 
match node1.next { 
Some(mut n) => n.next = Some(node1), 
None => {} 
} 
} 


编译 又 发 生 了 错误 ， 错 误 信 息 为 : “error: use of partially moved 
value: ‘nodel ”。 


这 是 因为 在 match 语 句 中 ， 我 们 把 nodel.next 的 所 有 权 转 移 到 了 局 
部 变量 n 中 ， 这 个 n 实 际 上 就 是 node2 的 实例 ， 在 执行 赋值 操作 
n.next=Some (nodel) 的 过 程 中 ， 编 译 器 认为 此 时 node1 的 一 部 分 已 经 
被 转移 出 去 了 ， 它 不 能 再 被 用 于 赋值 号 的 右边 。 


看 来 ， 这 是 因为 我 们 选择 使 用 的 指针 类 型 不 对 ，Box 类 型 的 指针 
对 所 管理 的 内 存 拥 有 所 有 权 ， 只 使 用 Box 指 针 没 有 办 法 构造 一 个 循环 
引用 的 结构 出 来 。 于 是 ， 我 们 想到 使 用 Rc 指针 。 同 时， 我 们 还 用 了 
Drop trait 来 验证 这 个 对 象 是 否 真正 被 释放 了 : 


use std::rc::Rc,; 


struct Node { 
next : Option<Rc<Node>> 
} 


impl Drop for Node { 
fn drop(&mut self) 区 
println!("drop"); 


} 


fn main() { 

let mut node1 = Node { next : None }; 
let mut node2 = Node { next : None }; 
let mut node3 = Node { next : None }; 
node1.next Some(Rc: :new(node2 ) ) ， 
node2 .next Some(Rc: :new(node3)); 
node3.next = Some(Rc: :new(node1)); 


编译 依然 没有 通过 ， 错 误 信 息 为 : “error: partial reinitialization of 
uninitialized structure`"node2`”， 还 是 没有 达到 目的 。 继 续 改 进 ， 我 们 将 
原来 “ 栈 ” 上 分 配 内 存 改 为 在 “ 堆 ” 上 分 配 内 存 : 


use std::rc::Rc,; 


struct Node { 
next : Option<Rc<Node>> 
} 


impl] Drop for Node { 
fn drop(&mut self) 区 
println!("drop"); 


} 


fn main() { 
Jet mut node1 = Rc::new(Node { next : None }); 
Jet mut node2 = Rc::new(Node { next : None }); 
let mut node3 = Rc::new(Node { next : None }); 


node1.next = Some(node2); 
node2.next = Some(node3); 
node3.next = Some(node1); 


编译 再 次 不 通过 ， 错 误 信 息 为 : “error: cannot assign to immutable 
field”。 通 过 这 个 错误 信息 ， 我 们 现在 应 该 能 想到 ，Rc 类 型 包含 的 数据 
是 不 可 变 的 ， 通 过 Rc 指针 访问 内 部 数据 并 做 修改 是 不 可 行 的 ， 必 须 用 
RefCel 把 它们 包 事 起 来 才 可 以 。 继 续 修 改 : 


use std::rc::Rc,; 
use std::cell::RefCell,; 


struct Node { 
next : Option<Rc<RefCell<Node>>> 


} 
impl Node { 
fn new() -> Node { 
Node { next : None} 
} 
} 


impl] Drop for Node { 
fn drop(&mut self) { 
println!("drop"); 
} 


fn alloc objects() { 


let node1 = Rc: :new(RefCell: :new(Node::new 
let node2 = Rc: :new(RefCell: :new(Node::new 
let node3 = Rc: :new(RefCell::new(Node::new 


node1.borrow mut().next = Some(node2.clone 
node2.borrow mut().next = Some(node3.clone 
node3.borrow mut().next = Some(node1.clone 


} 


fn main() { 
alloc_objects(); 
println!("program finished."); 


了 
了 


因为 我 们 使 用 了 RefCell， 对 Node 内 部 数据 的 修改 不 再 需要 mut 关 
键 字 。 编 译 通过 ， 执 行 ， 这 一 次 屏幕 上 没有 打印 任何 输出 ， 说 明了 本 
构 函 数 确 实 没 有 被 调用 。 


至 此 ， 终 于 实现 了 使 用 Rc 指 针 构 造 循 环 引 用 ， 制 造 了 内 存 泄 调 。 
本 世人 花费 这 么 多 笔墨 一 步 步 地 回 大 家 演示 如 何 构造 内 存 泄 凋 ， 主 
要 是 为 了 说 明 ， 虽 然 构造 循环 引用 非常 复杂 ， 但 是 可 能 性 还 是 存在 


的 ，Rust 无 法 从 根本 上 避免 内 存 泄 凋 。 通 过 循环 引用 构造 内 存 泄漏， 
ee 1) 使 用 引用 计数 指针 ，2) 存在 内 部 可 变 


3) 指针 所 指向 的 内 容 本 身 不 是 'static 的 。 


当然 ， 这 个 示例 也 说 明 ， 通 过 构造 循环 引用 来 制造 内 存 泄 漏 是 比 
较 复 杂 的 ， 不 是 轻而易举 就 能 做 到 的 。 构 造 循 环 引 用 的 复杂 性 可 能 也 
刚好 符合 我 们 的 期 望 ， 毕 竟 从 设计 原则 上 来 说 : 鼓励 使 用 的 功能 应 该 
设计 得 越 易 用 越 好 ;不 鼓励 使 用 的 功能 ， 应 该 设计 得 越 难 用 越 好 。 


Easy to Use，Easy to Abuse. 


对 于 上 面 这 个 例子 ， 要 想 避 免 内 存 泄 凋 ， 需 要 程序 员 手 动 把 内 部 
某 个 地 方 的 Rc 指针 替换 为 std: : rc: : Weak 弱 引用 来 打破 循环 。 这 是 
编译 需 无 法 大 我 们 静态 检查 出 来 的 。 


17.2 ”内 存 泄漏 属于 内 存 安全 


在 编程 语言 设计 这 个 层面 ,“ 内 存 泄漏 " 钙 一 个 基本 上 无 法 在 编译 
阶段 彻底 解决 的 问题 。 在 许多 场景 下 ， 什 么 是 “内 存 泄漏 ”、 什么 不 
征 “ 内 存 泄漏 ”， 本 身 束 没有 一 个 完全 客观 的 评判 标准 。 它 实质 上 跟 程 
序 员 的 “意图 ”有 关 。 程 序 很 难 目 动 判定 出 哪些 变量 是 以 后 还 会 继续 用 
的 ， 哪 些 是 不 再 被 使 用 的 。 


即便 是 在 使 用 GC 做 内 存 管 理 的 环境 下 ， 程 序 员 也 有 可 能 不 小 心 将 
不 应 该 被 使 用 的 变量 错误 引用 ， 造 成 无 法 自动 回收 的 问题 。 因 为 GC 判 
定 一 个 对 象 是 否 可 回收 的 标准 是 ， 这 个 对 象 有 没有 人 补 “ 根 ”对 象 直 接 或 
者 间接 引用 。 假 如 一 个 对 象 本 来 是 应 该 被 释放 的 ， 可 是 因为 逻辑 问 
题 ， 没 有 把 指 癌 它 的 有 效 引 用 全 部 释放 ， 那 么 GC 依旧 把 它 判 定 为 不 可 
回收 。 我 们 可 能 在 不 经 意 的 情况 下 ， 造 成 了 不 再 需要 继续 使 用 的 对 象 
被 生命 周期 更 长 的 对 象 所 引用 。 面 对 这 样 的 情况 ，GC 也 会 显得 无 能 为 
力 。 比 如 ， 在 android 编 程 领域 ， 我 们 可 能 会 在 注册 回调 函数 的 时 候 把 
一 个 较 大 的 activity 引 用 传递 过 去 ， 结 果 activity 应 该 被 销毁 的 时 候 ， 由 
于 还 有 其 他 变量 继续 持 有 指 同 它 的 引用 ， 从 而 导致 该 activity 变 量 无 法 
正名 被 释放 ， 这 种 现象 被 称 为 “Context 汇 漏 ?”。 解 决 这 个 问题 的 办 法 只 
能 是 ， 在 必要 的 地 方 使 用 “ 弱 引 用 ”(Weak Reference) ， 避 人 免 “ 强 引 
用 ”对 变量 生命 周期 的 影响 。 解 决 引 用 计数 的 循环 引用 的 办 法 与 此 类 
似 ， 也 是 一 样 用 “ 弱 引 用 ”来 打破 循环 ， 避 免 “ 强 引用 ?对 生命 周期 的 影 
啊 。 再 比如 在 javascript 中 注册 一 个 定时 器 ， 而 定时 喜 不 小 心 引 用 了 许 
多 大 对 象 ， 这 些 对 象 会 随 着 闭 包 加 入 到 主事 件 循环 队列 中 ， 也 会 造成 
类 似 的 结果 。 在 绝 大 部 分 情况 下 ，GC 给 我 们 带 来 了 方便 。 但 是 ， 程 友 
员 也 二 万 个 能 因为 有 GC 的 辅助 ， 而 包 略 对 变量 的 生命 周期 的 设计 考 
量 。 


手动 打破 循环 的 方式 来 解决 内 存 泄漏 的 问题 。 编 译 器 无 法 通过 静态 检 
查 来 保证 你 不 会 犯 这 个 错误 。 


内 存 泄漏 显然 是 一 种 bug。 但 它 跟 “内 存 不 安全 ”这 种 bug 的 性 质 不 
一 样 。“ 内 存 泄漏 ”是 对 “ 正 第 数据 ”的 “应 该 执行 但 是 没有 执行 ”的 操 
作 , “内存 不 安全 ”是 对 “不 正 第 数据 ”的 “不 应 该 执行 但 是 执行 了 ”的 操 


作 。 从 后 果 上 说 ,，“ 内 存 不 安全 ”导致 的 后 琳 比 “内 存 泄漏 "要 疗 重 得 
多 ， 如 表 17-1 所 示 。 


执行 了 
没 执行 内 存 潭 尘 


语言 的 设计 者 当然 是 希望 能 彻 展 解决 内 存 泄 漏 的 问题 。 但 是 很 可 
异 ， 这 个 问题 妨 怕 不 古 在 语言 层面 能 彻底 解决 的 问题 。 所 请 “彻底 解 
决 ”的 意思 是 ， 用 户 无 论 使 用 何 种 技巧 ， 永 远 无 法 构造 出 内 存 泄漏 的 情 
况 。Rnust 语 言 无 法 给 出 这 样 的 保证 。 笔 者 也 不 认为 GC“ 彻 底 解决 "了 内 
存 泄漏 的 问题 。 内 存 泄漏 当然 是 不 好 的 事情 ， 作 为 开发 者 ， 我 们 应 该 
尽 可 能 避免 内 存 泄 调 现象 的 发 生 。 然 而 ， 需 要 强调 的 是 ， 内 存 泄 漏 不 
属于 内 存 安全 的 范畴 ，Rust 也 不 会 在 语言 设计 层面 给 出 一 个 “免除 内 存 


泄漏 ”的 承诺 。 


To put it another way, Rust gives you a lot of safety guarantees, but 
it doesn't protect you from memory leaks (or deadlocks, which turns out 


to be a very similar problem) . 


17.3” 术 构 函 数 泄 疡 


上 面 的 例子 展现 了 如 何在 Rust 中 不 使 用 unsafe 代 码 制 造 内 存 泄 漏 。 
在 Rust 中 ， 在 不 经 意 则 不 小 心 制 造 内 存 泄漏 的 可 能 性 是 很 低 的 。 但 是 
这 个 可 能 性 还 是 存在 的 。 


然而 ， 内 存 泄漏 并 非 最 可 怕 的 情况 ， 因 为 内 存 泄 漏 只 造成 资源 当 
费 ， 毕 苋 没 有 造成 野 指针 等 更 为 户 重 的 内 存 安全 问题 。 上 面 的 例子 实 
际 上 还 暗示 了 另外 一 种 危险 性 ， 即 析 构 函数 泄漏 。 在 Rust 中 ，RAII 于 
法 用 得 非常 普 裔 ， 它 实际 上 要 求 程序 的 正确 性 依赖 于 术 构 函数 的 确定 
0 。 然而 让 我 们 担心 的 事情 是 ， 析 构 函 数 是 有 可 能 永远 不 会 被 调 


除了 前 面 展示 的 通过 循环 引用 导致 的 析 构 函数 泄漏 之 外 ， 还 有 许 
多 种 方式 可 以 产生 同样 的 效果 。 比 如 ， 我 们 构造 两 个 首尾 相连 的 
channel， 发 送 端 和 接收 端 连 到 一 起 ， 那 么 在 这 两 个 channel 里 面 传递 的 
对 象 融 进 入 了 和 死 循 环 ， 束 永远 不 会 被 析 构 了 。 


析 构 函数 泄漏 是 比 内 存 泄漏 更 闫 重 的 情况 。 因 为 析 构 函数 是 可 
以 “ 目 定义 ”的 ， 析 构 函 数 里 面 可 能 调用 “任意 的 ”代码 。 


我 们 一 直 在 强调 ，Rust 给 了 我 们 一 个 非常 强 的 保证 ， 即 “内 存 安 
全 ”。 这 个 保证 是 非常 闫 肃 认 真 的 。 这 个 保证 意味 着 ， 只 要 不 使 用 
unsafe， 用 户 永 远 无 法 构造 出 “内 存 不 安全 ”的 情况 。 然 而 ， 对 于 泄漏 问 
题 ，Rust 做 不 到 像 内 存 安全 这 种 程度 的 保证 。 所 以 ，Rust 设 计 者 不 得 
不 痛 藻 地 承认 ， 析 构 函 数 并 不 能 被 保 证 调用 。 大 家 不 要 读 解 了 这 上段 
话 ， 这 并 不 十 意味 着 Rust 会 轻 轻 松 松 、 时 时 刻 刻 造成 泄漏 ， 它 只 是 意 
味 看 ， 编 译 占 没 办 法 目 动 检查 出 所 有 可 能 的 资源 泄漏 问题 ， 并 给 出 编 


译 错误 或 警告 。 


承认 析 构 画 数 可 能 不 会 被 调用 (即便 在 不 使 用 unsafe 代 码 情况 
下 ) ， 并 不 会 造成 特别 严重 的 问题 一 除非 它 违反 了 “内 存 安全 ”。“ 内 
存 安全 ”一 直 是 Rust 坚 持 的 原则 和 底线 ， 这 条 原则 是 永远 不 能 被 破坏 
的 ， 否 则 Rust 就 失去 了 存在 的 意义 。 这 个 结论 直接 导致 了 下 面 几 个 比 
较 重 要 的 后 果 。 


其 一 ， 标 准 库 中 的 std: : mem: : forget 芳 数 去 挥 了 unsafe 标 记 。 


其 二 ， 人 允许 带 有 析 构 函数 的 类 型 ， 作 为 static 变 量 和 const 变 量 。 全 
局 变量 的 析 构 函数 最 后 古 泄漏 挥 了 的 ， 不 会 被 调用 。 以 前 曾经 规定 市 
析 构 函数 的 类 型 不 允许 作为 全 局 变量 ， 后 来 放宽 了 规定 ， 人 允许 作为 全 
局 变量 ， 但 是 析 构 函数 无 法 调用 。 


其 三 ， 标 准 库 中 不 安全 代码 需要 依赖 析 构 函数 调用 的 逻辑 得 到 修 
改 ， 其 中 涉及 Vec: : drain_range 和 Thread: : scoped 等 方法 。 


Rust 标 准 库 中 有 一 个 std: : mem: : forget 函 数 ， 这 个 方法 的 签名 
是 fn forget<T> (tT) 。 它 接受 的 参数 不 是 引用 类 型 ， 而 是 将 参数 
move 进 入 函数 体 中 ， 类 似 于 std: : mem: : drop。 但 它 与 drop 最 大 的 
区 别 是 ， 它 会 蛆 止 编译 絮 调 用 这 个 变量 的 析 构 函数 ， 也 不 会 释放 它 在 
堆 上 申请 的 内 存 。 它 的 作用 残 是 制造 泄漏 。 原 来 这 个 函数 是 unsafe 
的 ， 但 是 ， 当 设计 者 发 现 完 全 可 以 用 安全 代码 写 一 个 同样 效果 的 forget 
函数 ， 那 么 ， 它 的 unsafe 标 记 也 惑 没 有 什么 意义 了 。 因 此 ， 大 家 决 
定 ， 去 掉 forget 函 数 前 面 的 unsafe 标 记 。 这 个 函数 不 再 被 标记 为 
unsafe， 只 是 因为 设计 者 意识 到 了 泄漏 并 非 内 存 安全 问题 ，unsafe 关 键 
字 只 能 用 于 标记 跟 内 存 安 全 相关 的 问题 ， 并 非 意 味 着 鼓励 用 户 随意 使 
用 这 个 函数 。 那 么 它 有 什么 用 呢 ? 我 们 可 以 举 儿 个 例子 : 


:我们 有 一 个 未 初始 化 的 值 ， 我 们 不 布 望 它 执 行 析 构 函数 ; 
在 用 FFI 跟 外 部 函数 打交道 的 时 候 。 


即便 析 构 函数 泄漏 ， 也 不 应 造成 内 存 不 安全 。 这 个 结论 ， 直 接 导 
致 了 thread: : scoped 函 数 从 标准 库 中 移 除 。scoped 函 数 是 这 样 设计 
的 : scoped 玉 数 可 以 创建 一 个 线程 ， 跟 spawn 函 数 不 一 样 ， 它 保证 在 当 
前 函数 退出 以 前 ， 这 个 线程 必定 已 经 退出 。 这 样 一 来 ， 我 们 就 可 以 直 
接 使 用 引用 & 来 读 父 线程 读 局 部 变量 ， 或 者 用 &mnut 来 写 局 部 变量 ， 避 
免 了 Arc 的 运行 效率 损失 ， 是 非常 有 用 的 scoped 函 数 与 Spawn 函 数 的 区 
别 束 在 于 ， 它 保证 子 线程 一 定 会 在 当前 函数 退出 之 前 退出 ， 所 以 它 的 
生命 周期 比 当 前 函数 的 生命 周期 短 。 


// 以 下 示例 目前 无 法 编译 通过 , scoped 已 经 被 移 除 
use std::thread; 


fn main() { 


let mut vec = vec![0, 1, 2, 3, 4, 5, 6, 71]; 
{ 
let mut guards = Vec: :new(); 
for x in &mut vec { 
let guard = thread::scoped(move || { 
*x += 1; 
}); 
guards.push(guard); 
// guards 析 构 , 在 析 构 函数 中 等 待 子 线程 被 销毁 


// 子 线程 已 经 全 部 退出 
println!("{:?}", vec); 


这 个 scoped 函 数 的 实现 原理 是 ， 它 返回 一 个 JoinGuard 类 型 ， 在 这 
个 类 型 的 析 构 函数 中 阻塞 当前 线程 ， 等 待 子 线程 结束 。 所 以 ， 函 数 退 
出 之 前 ， 子 线程 必定 已 经 被 销毁 。 子 线程 中 用 到 的 指 癌 当前 函数 栈 的 
指针 ， 也 不 会 成 为 野 指 针 。 


粗 看 起 来 以 上 这 个 设计 二 不 错 的 ， 而 且 它 也 的 确 在 早期 版 本 的 
Rust 标 准 库 中 存在 了 一 段 时 间 。 然 而 可 惜 的 是 ， 这 个 设计 是 有 bug 的 ， 
它 会 造成 安全 代码 中 的 “内 存 不 安全 ”现象 。 问 题 在 哪里 呢 ? 问题 在 
于 “ 析 构 函数 泄漏 ”。 我 们 知道 ，Rust 无 法 保证 “ 析 构 函数 必定 被 调 
用 ”。 如 采 有 一 个 用 户 ， 想 办 法 将 这 个 JoinGuard 传 递 到 当前 函数 外 面 
去 了 ， 或 者 用 循环 引用 使 得 这 个 类 型 的 析 构 函数 永 不 调用 ， 就 出现 了 
析 构 泄漏 。 如 采 这 个 类 型 出 现 了 析 构 泄漏 ， 那 么 会 导致 这 个 于 线程 的 
生命 周期 并 不 会 限制 在 父 线程 的 当前 函数 执行 周期 之 内 ， 父 线程 的 当 
前 玉 数 退出 ， 了 于 线程 项 并 未 结束 ， 父 线程 的 贸 数 调用 栈 已 经 发 生变 
化 ， 而 子 线程 依然 有 能 力 访问 以 前 指向 的 那 块 内 存 。 这 是 一 个 典型 的 
内 存 安全 问题 。 


Rust 对 “内 存 安 全 ”是 不 允许 的 。 虽 然 上 面 叙 述 的 情况 在 正式 代码 
中 出 现 的 几率 很 小 ， 但 是 这 依旧 是 一 个 潜在 的 问题 。Rust 对 库 代 码 的 
质量 标准 是 : 不 论 使 用 何 种 奇 巧 ， 只 要 用 户 有 可 能 在 不 使 用 unsafe 构 
造 出 内 存 安全 ， 那 这 个 库 融 是 不 安全 的 、 不 可 接受 的 。 因 此 ，scoped 
玉 数 必须 从 标准 库 中 去 挥 ， 它 古 不 能 被 接受 的 。 它 违反 了 Rust 的 安全 
承诺 ， 将 安全 性 建立 在 “ 析 构 函数 必定 被 调用 ”的 假设 之 上 ， 而 这 个 假 
设 是 不 成 立 的 。 它 有 可 能 导致 不 使 用 unsafe 的 情况 下 ， 也 能 制造 出 “内 
存 不 安全 ”。 这 是 一 个 设计 失败 的 API。 


那么 用 什么 办 法 来 解决 这 个 问题 呢 ? 可 以 通过 改变 API 的 风格 来 
实现 。 如 果 说 RAII 式 的 风格 是 外 回 式 鸭 ， 那 么 对 应 鸭 “ 回 调 函 数 ? 式 的 
风格 惑 是 内 辐 式 的 。 什 么 是 外 回 式 的 和 内 辐 式 的 API 风 格 ? 我 们 拿 返 
代 需 来 打 比方 。Rust 的 迭代 噩 是 典型 的 外 回 式 的 风格 ， 它 骏 露 了 next 

() 方法 ， 由 使 用 者 决定 何 时 、 何 处 、 如 何 调用 。 我 们 还 可 以 设计 内 
同 式 的 迭代 风格 ， 它 的 写法 是 for_each (||{this is a closure}) 。 在 这 种 
方式 下 ， 使 用 者 只 能 传递 一 个 财 包 进去 ， 而 无 权 管 理 友 代 器 的 调用 。 
内 癌 式 的 API 对 使 用 者 来 说 灵活 性 就 比较 差 ， 比 如 ， 我 们 没 办 法 实现 
针对 两 个 容器 的 两 个 迭代 器 ， 分 别 轮流 调用 next () 方法 ， 或 者 在 和 
代 过 程 中 提前 中 止 等 。 


相 比 之 下 ，RAII 式 的 API 和 又 露 给 使 用 者 的 灵活 性 更 强 ， 而 回调 男 
数 式 的 API 对 使 用 者 的 约束 性 更 强 。 我 们 如 果 把 scoped 函 数 变 一 种 风 
格 ， 它 就 可 以 变 成 安全 的 了 。 这 个 尝试 ， 在 第 三 方 库 中 已 经 实现 ， 如 
果 大 家 需要 这 个 功能 ， 可 以 搜索 crossbeam 或 者 scoped_threadpool 这 两 
个 库 。 我 们 来 看 看 scoped_threadpool 是 如 何 使 用 的 : 


extern crate scoped_ threadpool,; 
Use scoped_threadpool::Pool; 


fn main() { 
let mut pool = Pool: :new(4); 


let mut vec = vec![0, 1, 2, 3, 4, 5, 6, 71]; 


pool,.scoped(|scope| { 
or e in &mut vec { 
scope.execute(move || { 
*e += 1; 
}); 
} 
}); 


println!("{:?}", vec); 


天 于 如 何 利用 cargo 工 具 引 用 外 部 库 ， 在 本 章 束 不 详细 解释 了 。 在 
这 里 我 们 只 关心 代码 逻辑 。 线 程 内 部 直接 使 用 了 &mnut vec 形 式 访问 了 
父 线程 " 栈 " 上 的 变量 。 这 个 scoped 函 数 的 使 用 方式 跟前 面 介绍 的 版 本 
相 比 更 复杂 ; 然而 ， 它 的 优点 是 安全 性 并 不 依赖 外 部 使 用 者 确保 * 析 构 
瑟 数 "的 调用 。 因 为 这 个 改变 ， 使 得 “等 竺 线程 结束 ”这 个 逻辑 从 库 的 使 
用 者 那 边 移 动 到 了 库 的 编写 者 那 边 。 库 的 编写 者 当然 可 以 保证 这 个 罗 
辑 必 然 彼 调用， 如 采 我 们 把 它 骏 露出 来 ， 交 给 使 用 者 来 调用 ， 囊 不 一 


定 了 。 上 所 以 说 ， 我 们 能 从 中 学 到 的 一 点 是 : 当 你 写 一 个 库 的 时 候 ， 如 
果 布 望 能 确保 某 个 方法 一 定 会 被 调用 ， 请 保证 这 上段 代码 在 你 目 己 的 挥 
制 之 中 ， 不 要 只 在 文档 中 描述 ， 要 求 使 用 着 主动 去 调用 。 


我 们 比较 一 下 scoped 函 数 和 spawn 函 数 的 签名 规则 : 


fn scoped<'pool, 'scope, F, R>(&'pool mut self, f: F) -> R 
where F: Fnonce(&Scope<'pool, 'scope>) -> R 


{} 
fn spawn<F, T>(f: F) -> JoinHandle<T> 
where F: Fnonce() -> T, F: Send + 'static, T: Send + 'static 


我 们 可 以 看 到 ， 对 于 闭 包 参数 F 类 型 的 约束 ，spawn 有 'static 生 命 周 
期 限制 ， 而 scoped 无 需 'static 生 命 周 期 限制 。 之 所 以 有 这 样 的 区 别 ， 原 
因 就 是 在 scoped 的 内 部 实现 中 保证 了 子 线程 一 定 会 在 父 线程 当前 函数 
退出 前 结束 ， 这 个 约束 条 件 不 是 随便 能 修改 的 。 在 它们 的 内 部 都 使 用 
了 unsafe 代 码 作 为 实现 细 方 ， 在 它们 的 外 部 都 使 用 了 合理 的 约束 条 件 
来 保证 线程 安全 。 所 以 我 们 需要 再 回 大 家 提醒 一 下 safe 和 unsafe 的 边界 
究 葛 在 哪里 。 哪 些 是 编译 絮 可 以 保证 的 ， 哪 些 是 编译 絮 无 法 保证 的 ， 
不 是 人 简单 就 说 得 清楚 的 事情 。 千 万 不 要 目 以 为 是 地 滥用 unsafe， 如 果 
又 露 的 外 部 接口 和 内 部 实现 不 匹配 ， 束 会 给 下 游 用 户 “ 控 坑 ?”， 很 容易 
导致 某 些 初学 者 误 以 为 Rust 的 内 存 安全 保证 是 骗 人 的 。 


汇 漏 是 一 个 麻烦 的 问题 ，Rust 在 这 个 问题 上 的 设计 涉及 许多 的 习 
协和 和 平衡， 其 间 引 发 了 大 量 的 纠结 、 讨 论 甚 至 争吵 。 正 是 : 


虚 多 情 损 栖 行 ， 
入 山 又 您 别 倾城 。 
世间 安 得 双全 法 ， 
不 负 如 来 不 负 昨 。 


第 18 章 ”Panic 
18.1 什么 是 panic 


在 Rust 中 ， 有 一 类 错误 叫 作 panic。 示 例如 下 : 


fn main() { 
let x : Option<i32> = None; 
x.unwrap(); 


编译 ， 没 有 错误 ， 执 行 这 段 程序 ， 输 出 为 : 


thread '<main>' panicked at "called ‘Option::unwrap() on a None ”Value '， 
,./Src/libcore/option.rs:326 
note: Run with “RUST_BACKTRACE=1 for a backtrace. 


这 种 情况 就 引发 了 一 个 panic。 在 这 上段 代码 中 ， 我 们 调用 了 
Option: : unwrap () 方法 ， 正 是 这 个 方法 有 可 能 导致 panic。 根 据 提 
示 ， 我 们 设置 一 个 环境 变量 RUST_BACKTRACE=1 之 后 再 执行 这 个 程 
序 ， 可 以 看 到 这 个 程序 在 发 生 panic 时 候 的 函数 调用 栈 。 


执行 RUST BACKTRACE=1./test， 结 果 为 : 


thread 'main' panicked at 'called ‘Option::unwrap(). on a ‘None value', 
./Src/libcore/option.rs:323 

stack backtrace: 

1: 0x10af488f8 - std::sys::backtrace::tracing::imp::write::h6f1d53a70916b90d 

2: 0x10af4a3af - std::panicking::default_ hook::{{closure}}::h1i37e876f7d3b5850 

3: 0x10af49945 - std::panicking::default_ hook::hoac3811iec7cee78c 

4: 0x10af49e96 - std::panicking::rust panic with hook::hc303199e04562edf 

5: 0x10af49d34 - std::panicking::begin panic::h6ed03353807cf54d 

6: 0x10af49c52 - std::panicking::begin_ panic_fmt::hc321icece241bb2f5 

7: 90x1oaf49bb7 - rust_begin_unwind 

8: 0x10af6fob0 - core::panicking::panic_fmt::h27224b181f9f037f 

9: 0x10af6efb4 - core::panicking::panic::h53676c30b3bd95eb 

10: 0x10af44804 - <core: :option::0ption<T>>: :unwrap::h3478e42c3c27faa3 

11: 0x10af44880 - test::main::h8a7a35fa594c0174 

12: 0Xx10af4a96a - rust_maybe_catch_panic 

13: Ox1i0af49486 - std::rt::lang_start::h538f8960e7644c80 

14: 0x10af448b9 - main 


我 们 去 查 一 下 Option: : unwrap () 的 文档 ， 其 中 是 这 么 说 的 : 


Moves the value v out of the Option<T> if it Is Some(v). 

Panics 
Panics if the self value equals None. 

Safety note 
In general, because this function may panic, its use is discouraged. 
Instead, prefer to use pattern matching and handle the None case explicitly. 


当 Option 内 部 的 数据 是 Some 时 ， 它 可 以 成 功 地 将 内 部 的 数据 move 
出 来 妈 回 。 


当 Option 内 部 的 数据 是 None 时 ， 它 会 发 生 panic。panic 如 果 没 有 被 
处 理 ， 它 会 导致 整个 程序 裔 溃 。 


在 Rust 中 ， 正 常 的 错误 处 理应 该 尽量 使 用 Result 类 型 。Panic 则 是 
作为 一 种 “fail fast* 机 制 ， 处 理 那 种 万 不 得 已 的 情况 。 


比如 ， 上 面 例子 中 的 unwrap 方 法 ， 试 图 把 Option<i32> 转 换 为 132 类 
型 ， 当 参数 是 None 的 时 候 ， 这 个 转换 是 没 办 法 做 到 的 ， 这 种 时 候 就 只 
能 使 用 panic。 所 以 ， 一般 情 况 下 ， 用 户 应 该 使 用 unwrap_or 等 不 会 制造 
panic 的 方法 。 


18.2 Panic 实 现 机 制 


在 Rust 中 ，Panic 的 实现 机 制 有 两 种 方式 : unwind 和 abort 。 

unwind 方 式 在 发 生 panic 的 时 候 ， 会 一 层 一 层 地 退出 函数 调用 栈 ， 
在 此 过 程 中 ， 当 前 栈 内 的 局 部 变量 还 可 以 正常 析 构 。 

"abort 方 式 在 发 生 panic 的 上 时候， 会 直接 退出 整个 程序 。 

在 常见 的 操作 系统 上 ， 默 认 情 况 下 ， 编 译 需 使 用 的 是 unwind 方 


式 。 所 以 在 发 生 panic 的 时 候 ， 我 们 可 以 通过 一 层 层 地 调用 栈 找到 发 生 
panic 的 第 一 现场 ， 束 像 前 面 例子 展示 的 那样 。 


但 是 ，unwind 并 不 是 在 所 有 平台 上 都 能 获得 民 好 文 持 的 。 在 某 些 
巾 入 式 系统 上 ，unwind 根 本 无 法 实现 ， 或 者 占用 的 资源 太 多 。 在 这 种 
时 候 ， 我 们 可 以 选择 使 用 abort 方 式 实现 panic 。 


”编译 器 提供 了 一 个 选项 ， 供 用 户 指定 panic 的 实现 方式 。 如 下 所 
pa 


rustc -C panic=unwind test.rs 
rustc -C panic=abort test.rs 


读者 可 以 试 试 上 面 两 个 编译 命令 ， 做 一 下 对 比 。 可 以 看 到 它们 生 
人 panic 时 的 行为 是 不 一 样 的 ， 生 成 的 可 执行 程序 大 小 也 不 


Rust 中 ， 通 过 unwind 方 式 实现 的 panic， 其 内 部 的 实现 方式 基本 与 
C++ 的 异常 是 一 样 的 。 而 且 ，Rnust 提 供 了 一 些 工 具 函 数 ， 可 以 让 用 户 
在 代码 中 终止 栈 展开 。 示 例如 下 : 


use std::panic; 


fn main() { 
panic::catch_ unwind(|| { 
let x : Option<i32> = None; 
x.unwrap(); 
println!("interrupted."); 


}) .ok(); 


println!("continue to execute."); 


编译 执行 可 见 ， 在 unwrap 语 句 后 面 的 这 条 打印 语句 并 未 执行 。 
为 在 上 一 条 语句 中 触发 了 panic， 这 个 函数 调用 栈 开 始 销毁 。 但 是 我 们 
有 一 句 catch_unwind 阻 止 了 函数 调用 栈 的 继续 展开 ， 残 像 C++ 里 面 的 
try-catch 机 制 一 样 。 因 此 ，main 方 法 并 没有 继续 被 销毁 ， 最 后 那 条 语 
句 可 以 正常 打印 输出 。 


如 果 我 们 尝试 使 用 “-C panic=abort”" 选 项 编译 上 面 的 代码 ， 可 以 看 
ee ， 最 后 那 条 语句 无 法 正常 打印 输 


但 是 ， 请 大 家 注意 ， 这 个 catch_unwind 机 制 绝对 不 是 设计 用 于 模 
拟 “try-catch” 机 制 的 。 请 大 家 永远 不 要 利用 这 个 机 制 来 做 正常 的 流程 控 
制 。Rust 推 荐 的 错误 处 理 机 制 是 用 返回 值 ， 第 33 章 讲解 Rust 的 错误 处 
理 机 制 。panic 出 现 的 场景 一 般 是 : 如果 继 续 执 行 下 去 就 会 有 极其 严重 
的 内 存 安全 问题 ， 这 种 时 候 让 程序 继续 执行 导致 的 危害 比 朋 汝 更 严 
pe i 。 它 的 主要 用 处 参考 下 面 
JJ 情 ; 


.在 FFI 场 景 下 的 时 候 ， 当 C 语 言 调用 了 Rnust 的 函数 ， 在 Rust 内 部 出 
现 了 panic， 如 果 这 个 panic 在 Rust 内 部 没有 处 理 好 ， 直 接 扔 到 C 代 码 中 
去 ， 会 导致 C 语 言 产生 “未 定义 行为 ”undefined behavior) 。 

: 某 些 高 级 抽象 机 制 需要 阻止 栈 展开 ， 比 如 线程 池 。 如 果 一 个 线程 


中 出 现 了 panic， 我 们 希望 只 把 这 个 线程 关闭 ， 而 不 至 于 将 整个 线程 
池 *“ 拖 下 水 ”。 


18.3 Panic Safety 


C++ 中 引入 了 "异常 这 个 机 制 之 后 ， 同 时 也 带 入 了 一 个 “异常 安 
全 ” (exception safety) 的 概念 。 对 这 个 概念 不 熟悉 的 读者 ， 建 议 阅读 
以 下 文档 : 

http:/www.stroustrup.com/except.pdf 


异常 安全 存在 四 种 层次 的 保证 


"No-throw 一 一 这 种 层次 的 安全 性 保证 了 所 有 的 异常 都 在 内 部 正确 
处 理 完毕 ， 外 部 坚 无 影响 ; 


Strong exception safety 一 一 强 异 常安 全 你 证 可 以 保证 异常 发 生 的 
时 候 ， 所 有 的 状态 都 可 以 “ 回 滚 ? 到 初始 状态 ， 不 会 导致 状态 不 一 致 的 


问题 ; 


基本 异常 安全 保证 可 以 保证 异常 发 生 的 


‘Basic exception Safety 


时 候 不 会 寻 致 资源 泄 漏 ; 


没有 任何 异常 安全 保证 。 


当 我 们 在 系统 中 使 用 了 “异常 * 的 了 时候， 就 一 定 要 想 清 楚 ， 每 个 组 
件 应 该 提供 哪 种 层级 的 异常 安全 保证 。 在 Rust 中 ， 这 个 问题 同样 存 
在 ,但 是 一 般 叫 作 panic safety， 与 “异常 ?说 的 是 同一 件 事 情 。 


下 面 我 们 来 用 代码 来 示例 “异常 安全 ”问题 会 如 何 影 响 我 们 的 代码 
实现 。 这 次 ， 我 们 用 标准 库 中 的 一 段 代 码 来 演示 。 下 面 的 代码 是 从 
src/liballoc/boxed.rs 中 复制 出 来 的 ，clone () 方法 目的 是 复制 一 份 新 的 
Box<[T]>: 


‘No exception safety 


impl<T: Clone> Clone for Box<[T]> { 
fn clone(&self) -> Self { 
Jet mut new = BoxBuilder 区 
data: RawVec: :with capacity(self.1len()), 
len: 0, 
}; 


let mut target = new.data.ptr(); 


for item in self.iter() { 
unsafe 区 
ptr::write(target, item.clone()); 
target = target.offset(1); 


了 


new.len += 1; 


} 
return unsafe { new.into_box() }; 


// Helper type for responding to panics correctly. 
struct BoxBuilder<T> { 

data: RawVec<T>, 

len: usize, 


} 


impl<T> BoxBuilder<T> { 
unsafe fn into_ box(self) -> Box<[T]> { 
let raw = ptr::read(&self .data); 
mem: :forget (self); 
raw.into_box() 
} 
} 


impl<T> Drop for BoxBuilder<T> { 
fn drop(&mut self) 区 
let mut data = self.data.ptr(); 
let max = unsafe { data.offset(self.]len as isize) }; 


while data != max { 
unsafe 区 
ptr::read(data); 
data = data.offset(1); 
} 
} 
} 
} 


这 上段 代码 的 实现 稍微 有 点 复杂 ， 但 是 逻辑 还 是 很 清楚 的 。 我 们 可 
以 先 不 考虑 标准 实现 ， 移 想 想 如 果 我 们 目 己 来 实现 会 怎么 做 。 要 clone 
() 一 份 Box<[T]>， 就 要 新 分 配 一 份 内 存 空 间 ， 循 环 把 每 个 元 素 clone 
() 一 遍 即 可 。 有 个 小 技巧 是 ， 构 造 Box<[T]> 可 以 用 RawVec: : 
into_box () 来 完成 ， 因 此 我 们 需要 一 个 RawVec 来 做 中 转 。 但 是 标准 
座 却 用 了 一 个 更 兢 烦 的 实现 方式 ， 大 家 需要 注意 BoxBuilder 这 个 类 型 
的 变量 是 干什么 的 。 


为 什么 明明 可 以 直接 在 一 个 方法 里 写 完 的 代码 还 要 引入 一 个 新 
的 类 型 呢 ? 原因 就 在 于 panic safety 问 题 。 注 意 我 们 这 里 调用 了 T 类 型 的 
clone 方 法 。TI 是 一 个 泛 型 参数 ， 谁 能 保证 clone 方 法 不 会 产生 panic? 没 


有 谁 能 保证 ， 我 们 只 能 尽 可 能 让 clone 发 生 panic 的 时 候 ，RawVec 的 状 
态 不 会 乱 掉 。 


所 以 ， 标 准 库 的 实现 利用 了 RAI 机 制 ， 即 便 在 clone 的 时 候 发 生 了 
panic， 这 个 BoxBuilder 类 型 的 局 部 变量 的 析 构 函数 依然 会 正确 执行 ， 
并 在 析 构 函数 中 做 好 清理 工作 。 上 面 这 段 代 码 之 所 以 捅 这 么 复业， 束 
征 为 了 保证 在 发 生 panic 的 时 候 远 辑 依然 是 正确 的 。 


大 家 可 以 去 翻 一 下 标准 库 中 的 代码 ， 有 大 量 类 似 的 模式 存在 ， 都 
是 因为 需要 考虑 panic safety 问 题 。Rust 的 标准 库 在 编写 的 时 候 有 这 样 
即便 发 生 了 panic， 也 不 会 产生 “内 存 不 安全 ”和 “线程 不 安 
全 ”的 情况 。 


在 Rust 中 ， 什 么 情况 下 panic 会 导致 bnug 呢 ? 这 种 情况 的 产生 需要 两 
个 条 件 : 

.panic 导 致 了 数据 结构 内 部 的 状态 错误 ; 

.这 个 错误 的 状态 会 在 以 后 被 观测 到 。 


在 unsafe 代 码 中 ， 这 种 情况 非常 容易 出 现 。 所 以 ， 在 写 unsafe 代 码 
的 时 候 ， 需 要 对 这 种 情况 非常 敏感 小 心 ， 一 不 小 心 就 可 能 因为 这 个 原 
因 制 造 出 “内 存 不 安全 ”。 


在 不 用 unsafe 的 情况 下 ，Panic Safety 是 基本 有 保障 的 。 考 虑 一 种 
场景 、 假 如 我 们 有 两 个 数据 结构 ， 我 们 希望 每 次 在 更 狐 其 中 一 个 的 时 
候 ， 也 要 对 另外 一 个 同步 更 新 ， 如 有 果 不 一 致 束 会 有 问题 。 万 一 更 新 了 
发 生 了 panic， 第 二 个 没有 正常 更 狐 怎 么 办 ? 代码 示例 如 


Use std::panic; 


fn main() { 

let mut x : Vec<i32> = vec![1]; 

let mut y : Vec<i32> = vec![2]; 

panic::catch _ unwind(|| { 
x.push(10); 
panic!("user panic"),; 
y.push(100); 

}).ok(); 


println!("Observe corruptted data. {:?} {:?}", x, y); 


这 里 我 们 必须 使 用 catch_unwind 来 阻止 栈 展开 ， 人 否则 这 两 个 数据 
结构 殉 一 起 被 销毁 了， 无 法 观测 到 panic 引 发 的 错误 状态 。 编 译 可 见 ， 
这 上 段 代 码 是 无 法 编译 通过 的 ， 错 误 如 下 : 


error[E0277]: the trait bound ‘&mut std::vec::Vec<i32>: std::panic::UnwindSsafe. 
is not satisfied 


这 是 什么 原因 呢 ? 因为 catch_unwind 的 签名 是 这 样 的 : 


pub fn catch_unwind<F: Fnonce() -> R + UnwindSafe, R>(f: F) -> Result<R> 


它 要 求 财 包 参 数 满足 UnwindSafe 和 条件， 而 标准 库 中 早 束 标记 好 J 
&mnut 型 指针 是 不 满足 UnwindSafe trait 的 。 有 些 类 型 ， 天 生 束 不 适合 在 
catch_unwind 的 外 部 和 内 部 同时 存在 。 


有 了 这 个 约束 条 件 ， 被 panic 破 坏 挥 的 数据 结构 被 外 部 继续 观测 、 
使 用 的 几率 就 小 了 许多 。 


当然 ， 编 译 器 是 永远 不 知道 用 户 的 真实 意图 的 ， 可 能 在 某 些 场景 
下 ， 用 户 就 是 要 这 样 写 ， 而 且 不 认为 这 些 数据 结构 是 “被 破坏 "的 状 
态 。 怎 么 修复 上 面 这 个 编译 错误 呢 ? 示例 如 下 ; 


use std::panic,; 
use std::panic::AssertUnwindsafe; 


fn main() { 

let mut x : Vec<i32> = vec![1]; 

let mut y : Vec<i32> = vec![2]; 

panic::catch_ unwind(AssertUnwindSsafe(|| { 
x.push(10); 
panic!("user panic"),; 
y.push(100); 

})).ok(); 


println!("Observe corruptted data. {:?} {:?}", x, y); 


我 们 可 以 用 AssertUnwindSafe 把 这 个 财 包 包 一 层 ， 残 可 以 强制 突 
破 编 译 絮 的 限制 了 。 我 们 也 可 以 单独 为 某 个 变量 来 包 一 层 ， 可 以 起 到 
一 样 的 效果 。AssertUnwindSafe 这 个 类 型 ， 不 管内 部 包含 的 是 什么 数 


据 ， 它 都 是 满足 catch_unwind 函 数 约 束 的 。 这 个 设计 至 少 能 保证 
catch_unwind 可 能 造成 的 风险 是 显 式 标记 出 来 的 。 


同 理 ， 在 多 线程 情况 下 也 有 类 似 的 问题 。 比 如 ， 我 们 把 第 29 章 经 
量 的 程序 改 改 ， 在 其 中 某 个 线程 中 制 


一 个 panic: 


use std::sync::Arc,; 
use std::sync::Mutex,; 
use std::thread; 


const COUNT: U32 = 1000000 ， 


fn main() { 
let global = Arc: :new(Mutex: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in 0..COUNT { 
match clonel1.1lock(){ 
Ok(mut value) => *value +=1, 
Err(poisoned) => { 
let mut value = poisoned.into_inner(); 
*value += 1; 


}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in 0..COUNT { 
let mut value = clone2.1lock().unwrap(); 
*value -= 1; 
if *value < 100000 { 
println!("make a panic"),; 
panic!(""),; 


} 
}); 


thread1.join().ok(); 
thread2.join().ok(); 
println!("final value: {:?}", global); 


在 thread2 中 ， 在 达到 某 个 条 件 的 情况 下 会 发 生 panic。 这 个 panic 是 
在 Mutex 锁 定 的 状态 下 发 生 的 。 这 时 ， 标 准 库 会 将 Mutex 设 置 为 一 个 特 
殊 的 称 为 poisoned 状 态 。 。 处 在 这 个 状态 下 的 Mutex， 再 次 调用 lock， 会 
返回 Er 状态 。 它 里 面 依然 包含 了 原来 的 数据 ， 只 不 过 用 户 需 要 显 式 调 


用 into_inner 才 能 使 用 它 。 这 种 方式 防止 了 用 户 在 不 小 心 的 情况 下 产生 
异常 不 安全 的 风险 。 
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Rust 语 言 是 跟 C++ 非 常 相似 的 一 门 语言 。 它 们 的 定位 相似 ， 目 标 
一 致 ， 都 没有 GC， 都 面 癌 确 层 硬件 ， 都 硕 望 所 供 比较 好 的 高 级 抽象 能 
力 ， 都 对 性 能 有 非常 高 的 要 求 。 而 这 也 意味 着 ， 在 许多 情况 下 ， 它 们 
会 磁 到 同样 的 问题 ， 有 着 类 似 的 设计 思路 。 


Rust 跟 C++ 最 大 的 区 别 在 于 ， 它 彻底 摊 脱 了 C/C++ 遗留 下 来 的 “前 

回 兼 容 性 ”包容 ， 可 以 大 刀 益 径 地 引入 一 些 在 其 他 语言 中 早已 被 证 明了 
的 优秀 设计 。Rust 在 保持 底层 定位 的 同时 ， 把 关注 点 主要 放 在 了 “安全 
性 ”问题 上 。 除 了 前 面 介绍 的 “内 存 安全 ”、“ 线 程 安 全 ”，Rust 在 “ 异 第 安 
全 "方面 的 设计 也 非常 不 错 ， 只 是 比较 少 用 于 拿 出 来 宣传 而 已 ， 毕 竟 只 
有 C++ 征 跟 Rust 遭 遇 了 类 似 的 问题 ， 其 他 目 市 GC 的 语言 ， 在 这 个 问题 
上 基本 没什么 需要 特别 关注 的 。 在 这 个 问题 上 ，Rust 通 过 一 系列 设 

计 ， 将 这 个 问题 基本 控制 在 了 unsafe 代 码 中 。 在 safe 代 码 部 分 ， 编 译 器 
会 将 可 能 发 生 异 常安 全 的 部 分 提示 出 来 ， 让 用 户 显 式 处 理 ， 用 户 基 本 

` 会 由 于 不 小 心 被 这 个 问题 “ 坑 ” 到 。 


虽然 Rust 抛 弃 了 “兼容 性 ?这样 一 个 巨大 的 负担 ， 但 是 ， 这 并 不 意 
味 着 设计 这 样 一 门 语言 是 件 轻松 的 事情 。 在 “系统 级 "编程 语言 这 个 " 紧 
短 泥 ?之 下 ， 很 多 看 似 简单 的 方面 都 需要 权衡 和 妥协 。 比 如 ,“ 吻 用 
性 ”简洁 性 * 总 是 永远 排 在 “安全 性 “性 能 ”这样 的 目标 后 面 。 这 也 注定 
了 Rust 的 内 在 复杂 性 并 不 低 。 


最 后 要 强调 的 是 ，panic 并 不 意味 着 “内 存 不 安全 ”， 愉 恰 相 反 ， 它 
古 阻 止 “ 内 存 不 安全 ”的 利器 。 内 存 不 安全 造成 的 问题 比 程序 突 然 退 出 
要 严重 得 多 。 在 即将 发 生 内 存 不 安全 现象 的 时 候 ， 如 采 当 时 已 经 没有 
任何 其 他 选择 ，panic 至 少 可 以 避免 最 坏 情况 的 发 生 。 然 后 我 们 可 以 很 
快 发 现 事 故 的 第 一 现场 ， 从 而 修复 代码 ， 使 其 继续 执行 。 


第 19 蔓 ”Unsafe 


到 目前 为 止 ，Rust 的 设计 让 人 觉得 非常 放心 。 利 用 类 型 系统 消除 
空 指针 ， 简 污 明 了 的 “唯一 修改 权 ? 原 则 ， 消 除了 野 指 针 ， 还 有 各 种 智 
能 指针 可 以 使 用 ， 甚 至 可 以 利用 同样 的 规则 消除 多 线程 环境 下 的 数据 
竞争 ， 这 一 切 就 像 一 组 向 洁 的 数学 定理 一 样 ， 构 建 了 一 整 余 清晰 的 “内 
存 安全 ”代码 的 “世界 观 ”。 

但 十 这 只 是 Rust 的 一 部 分 。 还 有 一 些 情况 ， 编 译 表 的 静态 检查 是 
不 够 用 的 ， 它 没 办 法 目 动 推理 出 来 这 段 代码 究 葛 钙 不 是 安全 的 。 这 种 
时 候 ， 我 们 就 需要 使 用 unsafe 关 键 字 来 保证 代码 的 安全 性 。 


本 章 简 单 介绍 一 下 Rust 的 unsafe 代 但 。 


19.1 unsafe 关 键 字 


Rust 的 unsafe 关 键 字 有 以 下 几 种 用 法 : 

:用 于 修饰 男 数 fn; 

:用 于 修饰 代码 块 ; 

:用 于 修饰 trait; 

:用 于 修饰 impl 。 

当 一 个 fn 是 unsafe 的 时 候 ， 和 意味 着 我 们 在 调用 这 个 函数 的 时 候 需 要 
非常 小 心 。 它 可 能 要 求 调用 者 满足 一 些 其 他 的 重要 约束 ， 而 这 些 约束 
条 件 无 法 由 编译 器 自动 检查 来 保证 。 有 unsafe 修 饰 的 函数 ， 要 么 使 用 


unsafe 语 句 块 调用 ， 要 么 在 unsafe 函 数 中 调用 。 因 此 需要 注意 ，unsafe 
函数 是 具有 “传递 性 ”的 ，unsafe 函 数 的 “调用 者 ”也 必须 用 unsafe 修 师 。 


比如 ，String: : from_raw_parts 丈 是 一 个 unsafe 函 数 ， 它 的 签名 如 
下 : 


pub unsafe fn from raw_parts(buf: 


*mut u8, length: usize, capacity: usize) -> 
String 


它 之 所 以 是 unsafe 的 ， 是 因为 String 类 型 对 所 有 者 有 一 个 保证 : 它 
内 部 存储 的 是 合法 的 utf-8 字 符 串 。 而 这 个 琅 数 没有 检查 传递 进来 的 这 
个 缓冲 区 是 否 满足 这 个 条 件 ， 所 以 使 用 者 必须 这 样 调用 : 


// ,保证 这 个 缓冲 区 包含 的 是 合法 的 utf-8 字符 串 
let s = unsafe { String::from raw_parts(ptr as *mut _, len, capacity) } ， 


上 面 这 个 写法 就 是 unsafe 代 码 块 的 用 法 。 使 用 unsafe 关 键 字 包 围 起 
来 的 语句 块 ， 里 面 可 以 做 一 些 一 般 情况 下 做 不 了 的 事情 。 但 是 ， 它 也 
是 有 规矩 的 。 与 普通 代码 比 起 来 ， 它 多 了 以 下 几 项 能 


对 裸 指针 执行 解 引用 操作 ; 
' 读 写 可 变 静 态 变 量 


. 读 union 或 者 写 union 的 非 Copy 成 员 ; 


.调用 unsafe 函 数 。 

在 Rust 中 ， 有 些 地 方 必 须 使 用 unsafe 才 能 实现 。 比 如 标准 库 提 供 的 
一 系列 intrinsic 函 数 ， 很 多 都 是 unsafe 的 ， 再 比如 调用 extern 函 数 必 须 在 
unsafe 中 实现 。 另 外 ， 一 些 重要 的 数据 结构 内 部 也 使 用 了 unsafe 来 实现 


一 些 功 能 。 
当 unsafe 修 饰 一 个 trait 的 时 候 ， 那 么 意味 着 实现 这 个 trait 也 需要 使 
用 unsafe。 比 如 在 后 面 讲 线程 安全 的 时 候 会 着 重 讲解 的 Send、Sync 这 
两 个 trait。 因 为 它们 很 重要 ， 是 实现 线程 安全 的 根基 ， 如 果 由 程序 员 
告诉 编译 恬 ， 强 制 指定 一 个 类 型 是 否 满足 Send、Sync， 那 么 程序 员 
自己 必须 很 谨慎 ， 必 须 很 清楚 地 理解 这 两 个 trait 代 表 的 含义 ， 编 译 需 
是 没有 能 力 推 理 验 证 这 个 impl 是 否 正 确 的 。 这 种 impl 对 程序 的 安全 性 


影响 很 大 。 


19.2” 裸 指针 


Rust 近 供 了 两 种 襟 指针 供 我 们 使 用 ，*constT 和 *mutT。 我 们 可 以 
通过 *mut 工 修改 所 指 问 的 数据 ， 而 *const T 不 能 。 在 unsafe 代 码 块 中 它 
们 俩 可 以 互相 转换 。 


裸 指针 相对 于 其 他 的 指针 ， 如 Box，&&，&mut 来 说 ， 有 以 下 区 


' 锐 指针 可 以 为 空 ， 而 且 编 译 器 不 保证 裸 指针 一 定 指 同 一 个 合法 的 
内 存 地 址 ; 


:不 会 执行 任何 自动 化 清理 工作 ， 比 如 自动 释放 内 存 等 ; 


裸 指 针 赋值 操作 执行 的 是 简单 的 内 存 浅 复制 ， 并 有 旦 不 存在 borrow 
checker 的 限制 。 

创建 裸 指 针 是 完全 安全 的 行为 ， 只 有 对 裸 指 针 执 行 “ 解 引用 ” 才 是 
不 安全 的 行为 ， 必 须 在 unsafe 语 句 块 中 完成 。 


示例 代码 如 下 : 


fn main() { 
let x = 1 i32; 
let mut y : U32 = 1; 


let raw_mut = &mut y as *mut u32 as *mut i32 as *mut i64; // 这 是 安全 的 


unsafe 区 
*raw_mut = -1;  // 这 是 不 安全 的 , 必须 在 unsafe 块 中 才能 通过 编译 


println!("{:X} {:X}", X/ y); 


我 们 可 以 把 裸 指 针 通 过 as 运算 符 执行 类 型 转换 。 转 换 类 型 之 后 ， 
它 束 可 以 把 它 所 指向 的 数据 当成 男 外 一 个 类 型 来 操作 了 。 原 本 变量 y 的 
类 型 是 u32， 但 是 我 们 对 它 取 地 址 后 ， 最 后 将 指针 类 型 转换 成 了 i64。 
此 时 ， 我 们 对 该 指针 所 指向 的 地 址 进行 修改 会 发 生 “ 类 型 安全 ”问题 以 
及 “内 存 安全 ?问题 。 编 译 ， 执 行 ， 这 段 代码 的 执行 结 采 为 : 


FFFFFFFF FFFFFFFF 


可 见 ，x 原 本 是 一 个 在 栈 上 存在 的 不 可 变 绑 定 ， 在 我 们 通过 裸 指 针 
对 y 做 了 修改 之 后 ，x 的 值 也 发 生 了 变化 。 原 因 束 是 ， 我 们 对 指向 y 的 指 
针 类 型 做 了 转换 ， 主 它 以 为 目 己 指 辐 的 是 i64 类 型 ， 恰 巧 x 束 在 y 劳 边 ， 
城 门 失火 ， 殊 及 池 鱼 ，x 就 被 顺带 一 起 修改 了 。 从 这 个 示例 我 们 可 以 看 
到 ，unsafe 代 码 中 可 以 做 很 多 危险 的 事情 。 上 面 这 个 例子 就 是 一 个 错 
误 的 unsafe 用 法 。 


再 比如 : 


fn raw_to_ref<'a>(p: *const i32) -> &'a i32 { 
unsafe f{ 
&*p 


fn main() { 
let p : &i32 = raw to_ref(std::ptr::null::<i32>()); 
printin!("{}", p); 


编译 ， 执 行 ， 可 以 看 到 发 生 了 core dump。 为 什么 呢 ? 因为 unsafe 
代码 写 错 了 。 这 上 段 代 码 里 面 直接 用 unsafe 功 能 把 一 个 裸 指针 转换 为 了 
一 个 共享 引用 ， 忽 略 了 Rust 里 面 共享 引用 必须 遵循 的 规则 。 在 Rust 
中 ，& 型 引用 、&mnut 型 引用 以 及 Box 指 针 ， 全 部 要 求 是 合法 的 非 空 指 
秆 。 在 unsafe 代 码 中 ， 我 们 必须 自己 从 逻辑 上 保证 这 一 点 ， 否 则 就 是 
不 可 容忍 的 严重 bug。 (注意 在 safe 代 码 中 是 没 办 法 构造 出 这 样 的 场景 
的 。) 有 些 初学 者 可 能 会 在 写 FFI， 封 装 C 代 码 的 时 候 犯 这 样 的 错误 。 
攻 正 记 伟 好 本 


fn raw_ to_ref<'a>(p: *const i32) -> Option<&'a i32> { 
If p.is _ null() { 
None 
} else 
unsafe { Some(&*p) } 


fn main() { 
let p : Option<&i32> = raw to_ref(std::ptr::null::<i32>()); 
println!("{:?}", p); 


Rust 的 各 种 指针 还 有 一 些 重要 约束 ， 比 如 &mnut 型 指针 最 多 只 能 后 
时 存在 一 个 。 这 些 约束 条 件 ， 在 unsafe 场 景 下 是 很 容易 被 打破 的 ， 而 
编译 器 并 没有 能 力 帮 有 我们 目 动 检查 出 来 。 我 们 之 所 以 需要 unsafe， 只 
是 因为 某 些 代码 只 有 在 特定 条 件 下 才 是 安全 的 ， 而 这 个 条 件 我 们 没有 
办 法 利用 类 型 系统 表达 出 来 ， 所 以 这 时 候 需 要 依靠 我 们 目 己 来 保证 。 


大 家 于 万 不 要 到 处 渡 用 unsafe 。 当 你 不 得 不 使 用 unsafe 的 上 时候， 请 
一 定 注 意 ， 这 并 不 意味 着 你 就 可 以 乱 写 不 安全 的 代码 ， 相 反 ， 它 的 意 
思 是 “编译 器 请 相信 我 ， 这 段 代 码 依 然 是 安全 的 ， 它 的 安全 性 由 我 自己 


负责 ” 


裸 指 针 也 有 很 多 有 用 的 成 员 方法 ， 读 者 可 以 参考 标准 文档 中 
的 “Primitive Type Pointer”。 比 如 ， 裸 指针 并 不 直接 文 持 算术 运算 ， 而 
了 一 系列 成 员 方法 offset wrapping_offset 等 来 实现 指针 的 偏 移 运 


19.3 ”内置 画 数 


在 标准 库 中 ， 有 一 个 std: : intrinsics 模 块 ， 它 里 面包 含 了 一 系列 的 
编译 项 内 置 国 数 。 这 些 函 数 都 有 一 个 extern'"rust-intrinsic" 修 饰 ， 它 们 看 
起 来 都 像 一 种 特殊 的 FFI 外 部 函数 ， 大 家 打开 标准 库 的 源 代 码 
src/core/intrinsics.rs， 可 以 看 到 这 些 函 数 根 本 没有 函数 体 ， 因 为 它们 的 
实现 是 在 编译 器 内 部 ， 而 不 是 在 标准 库 内 部 。 调 用 它们 的 时 候 都 必须 
使 用 unsafe 才 可 以 。 编 译 絮 见 到 这 些 芳 数 ， 就 知道 应 该 生成 什么 样 的 代 
码 ， 而 不 是 像 普 通 函 数 调用 一 样 处 理 。 另 外 ，intrinsics 是 藏 在 一 个 
feature gate 后 面 的 ， 这 个 feature 可 能 永远 不 会 稳定 ， 这 些 函 数 束 不 是 准 
备 直 接 提 供给 用 户 使 用 的 。 一 般 标 准 库 会 在 这 些 函 数 基础 上 做 一 个 更 
合适 的 封装 给 用 户 使 用 。 


下 面 就 在 这 些 画 数 中 挑 一 部 分 作 介绍 。 


19.3.1 transmute 


fn transmute<T，U> (e: T) ->U 函 数 可 以 执行 强制 类 型 转换 。 把 
一 个 T 类 型 参数 转换 为 U 类 型 返回 值 ， 转 换 过 程 中 ， 这 个 参数 的 内 部 二 
进 制 表示 不 变 。 但 是 有 一 个 约束 条 件 ， 即 size_of: : <T> () 
==size_of: : <U> () 。 如 果 不 符合 这 个 条 件 ， 会 发 生 编译 错误 。 
transmute_copy 的 作用 跟 它 类 似 ， 区 别 是 ， 参 数 类 型 是 一 个 借用 为 &T。 


一 般 情 况 下 ， 我 们 也 可 以 用 as 做 类 型 转换 ， 把 &T 类 型 指针 转换 为 
裸 指针 ， 然 后 再 转换 为 &U 类 型 的 指针 。 这 样 也 可 以 实现 类 似 的 功能 。 
但 是 用 户 自 己 实现 的 沁 型 画 数 有 一 个 缺陷 ， 即 无 法 在 where 条 件 中 目 己 
表达 size_of: : <T> () ==size_of: : <U> () 。 而 transmute 作 为 一 个 
内 置 函 数 束 可 以 实现 这 样 的 约束 。 


transmute 和 transmute_copy 在 std: : mem 模 块 中 重新 导出 。 用 户 如 
果 需 要 ， 请 使 用 这 个 模块 ， 而 不 是 std: : intrinsics 模 块 。 


下 面 用 一 个 示例 演示 一 下 Vec 类 型 的 二 进 制 表示 是 怎样 的 ; 


fn main() { 
let x = vec![1,2,3,4,5]; 


unsafe { 
let t : (usize, usize, usize) = std::mem::transmute_copy(&x); 
printin!("{} 0 如", t.0, t.1, t.2); 
} 
} 


上 面 的 例子 中 ， 我 们 调用 了 transmute_copy， 因 此 参数 类 型 是 
&vec。 假 如 我 们 用 transmnute 函 数 ， 参 数 类 型 加 必须 是 Vec， 区 别 在 于 ， 
参数 会 被 move 进 入 这 个 函数 中 ， 在 后 面 束 不 能 继续 使 用 了 。 在 调用 
transmute_copy 芳 数 的 时 候 ， 必 须 显 示 指 定 返 回 值 类 型 ， 因 为 它 古 沁 型 
函数 ， 返 回 值 类 型 可 以 有 多 种 多 样 的 无 穷 变 化 ， 只 要 满足 size_of: : 
<T> () ==size_of: : <U> () 和 条件， 都 可 以 完成 类 型 转换 。 所 以 编译 
独自 己 是 无 法 自动 推理 出 返回 值 类 型 的 。 在 上 例 中 ， 我 们 的 返回 值 类 
型 是 包含 三 个 usize 的 tuple 类 型 。 这 是 因为 ，Vec 中 实际 包含 了 3 个 成 
员 ， 一 个 是 指 回 扒 上 的 指针 ， 一 个 是 指 回 内 存 空间 的 总 大 小 ， 还 有 一 
个 是 实际 使 用 了 的 元 系 个 数 ， 因 此 这 个 类 型 转换 从 编译 需 看 来 是 满 
足 “ 占 用 内 存 空间 相同 ”这 一 条 件 的 。 


编译 执行 ， 我 们 整 可 以 看 到 Vec 内 部 的 具体 内 存 表示 了 。 执 行 结 来 
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19.3.2” 内存 读 写 


intrinsics 模 块 里 面 有 几 个 与 内 存 读 写 相 关 的 函数 ， 比 如 copy、 
copy_nonoverla-pping、Wwrite_bytes、move_val_init、volatile_load 等 。 这 
些 函 数 又 在 std: : ptr/std: : mem 模 块 中 做 了 个 人 徐 单 封装 ， 然 后 又 露 出 
来 给 用 户 使 用 。 下 面 挑 其 中 几 个 重要 的 函数 介绍 。 


1.copy 


copy 的 完整 签名 是 unsafe fn copy<T> (src: *constT,，dst: *mut 
T，count: usize) 。 它 做 的 就 是 把 src 指 向 的 内 容 复制 到 dst 中 去 。 它 跟 
C 语 言 里 面 的 memmove 类 似 ， 都 假设 src 和 dst 指 同 的 内 容 可 能 有 重合 。 
区 别 是 memmove 的 参数 是 void* 类 型 ， 第 三 个 参数 是 字 节 长 度 ， 而 
ptr: : copy 的 指针 是 带 类 型 的 ， 第 三 个 参数 是 对 象 的 个 数 。 


这 个 模块 中 还 提供 了 ptr: : copy_nonoverlapping。 它 跟 C 语 言 里 面 
的 memcpy 很 像 ， 都 假设 用 户 已 经 保证 了 src 和 dst 指 癌 的 内 容 不 可 重 琶 。 
所 以 ptr: : copy_nonoverlapping 的 执行 速度 比 ptr: : copy 要 快 一 些 。 


2.write 


在 ptr 模 块 中 ，write 的 签名 是 unsafe fn write<T> (dst: *mnut 工 ， 
src: T) ， 作 用 是 把 变量 src 写 入 到 dst 所 指向 的 内 存 中 。 注 意 它 的 参数 
src 是 使 用 的 类 型 T， 执 行 的 是 move 语 义 。 查 看 源码 可 知 ， 它 是 基于 
intrinsics: : move_val_init 实 现 的 。 注 意 ， 在 写 的 过 程 中 ， 不 管 dst 指 癌 
容 是 什么 ， 都 会 被 直接 覆盖 掉 。 而 src 这 个 对 象 也 不 会 执行 析 构 画 


写 内 存 还 有 ptr: : write_bytes、ptr: : write unaligned、ptr: : 
write_vol-a-tile 等 函数 。 


3.read 


在 ptr 模 块 中 ，read 的 签名 是 unsafe fn read<T> (src: *const T) - 
>T， 作 用 是 把 src 指 向 的 内 容 当 成 类 型 T 返 回去 。 查 看 它 的 内 部 源码 ， 
可 见 它 就 是 基于 ptr: : copy_nonoverlapping 实 现 的 。 


读 内 存 还 有 ptr: : read_unaligned 以 及 ptr: : read_volatile 两 个 男 
数 ， 大 同 小 异 。 


以 上 这 些 内 存 读 写 函 数 ， 都 是 不 管 语义 ， 直 接 操 作 内 存 中 的 字 
亡 。 所 以 它们 都 是 用 unsafe 函 数 。 


4.Swap 


在 ptr 模 块 中 ，swap 的 签名 是 unsafe fn swap<T> (x: *mut 工 ，y: 
*mut T) ， 作 用 是 把 两 个 指针 指向 的 内 容 做 交换 。 两 个 指针 所 指向 的 
对 和 象 都 只 是 被 修改 ， 而 不 会 被 析 构 。 


这 个 函数 在 mem 模 块 中 义 做 了 一 次 封 狼 ， 变 成 了 unsafe fn swap<T> 
(x: &mutT，y: &mutT) 供用 户 使 用 。 签 名 中 的 &mut 型 引用 可 以 保 
证 这 两 个 指针 是 当前 唯一 指向 该 对 象 的 指针 。 


某 些 特殊 类 型 还 有 目 己 的 swap 成 员 函 数 。 比 如 Cell: : swap 
(&self，other: &Cell<T>) 。 这 个 函数 跟 其 他 swap 画 数 最 大 的 区 别 在 
于 ， 它 的 参数 只 要 求 共享 引用 ， 不 要 求 可 变 引 用 。 这 是 因为 Cell 本 身 的 
特殊 性 。 它 具备 内 部 可 变性 ， 所 以 这 么 设计 是 完全 安全 的 。 我 们 可 以 
从 源码 看 到 ， 它 就 是 简单 地 调用 了 ptr: : swap。 


5.drop_in_place 

在 ptr 模 块 中 ，drop_in_place 的 签名 是 unsafe fn drop_in_place<T: ? 
Sized> (to_drop: *mut T) 。 它 的 作用 是 执行 当前 指向 对 象 的 析 构 画 
数 ， 如 果 没 有 就 不 执行 。 


6.uninitialized 


在 mem 模 块 中 ，uninitialized 的 签名 是 unsafe fn uninitialized<T> 
() ->T。 它 是 基于 intrinsics: : uninit 函 数 实现 的 。 我 们 知道 ，Rust 编 
译 姨 要 求 每 个 变量 必须 在 初始 化 之 后 再 使 用 ， 如 果 在 某 些 情况 下 ， 你 
确实 需要 未 初始 化 的 变量 ， 那 么 必须 使 用 unsafe 才 能 做 到 。 注 意 ， 任 何 
时 候 读 取 未 初始 化 变量 都 是 未 定义 行为 ， 请 大 家 不 要 这 么 做 。 即 便 你 
在 unsafe 代 码 中 创造 了 未 初始 化 变量 ， 也 需要 自己 在 逻辑 上 保证 ， 读 取 
这 个 变量 之 前 先 为 它 合 理 地 赋 过 值 。 


另外 ， 这 个 函数 有 点 像 std: : mem: : forget， 调 用 这 个 函数 ， 不 
仅 不 会 在 程序 中 增加 代码 ， 反 而 会 减少 可 执行 代码 。 调 用 forget， 会 导 
致 编译 避 不 再 插入 析 构 函数 调用 的 代码 ， 调 用 uninitialized 会 导致 缺少 
初始 化 。 它 们 没有 任何 运行 开销 。 


uninitialized 芳 数 也 还 没有 稳定 ， 它 有 一 些 无 法 克服 的 缺陷 ， 将 来 
标准 库 会 废弃 掉 这 个 函数 ， 而 使 用 一 个 新 的 类 型 让 用 户 在 unsafe 代 码 中 
创建 未 初始 化 变量 。 


19.3.3 ”综合 示例 


下 面 我 们 用 一 个 示例 来 演示 一 下 这 些 unsafe 芳 数 的 用 途 ， 以 及 怎样 
才能 正确 调用 unsafe 人 代码。 示例 很 丛 单 ， 束 是 实现 标准 库 中 的 内 存 交 换 
函数 std: : mem: : Swap。 


我 们 可 以 确定 这 个 函数 的 签名 是 fn swap<T> (x: &mutT，Yy: 
&mut T) 。 关 于 泛 型 的 解释 在 第 21 章 中 有 ， 此 处 略 过 不 提 。 先 试 一 个 
最 简单 的 实现 ; 


fn Swap<T> (xX: &mut T, y: &mut T) { 
一 * 中 
党 X 7 


*y = Z 
} 


编译 不 通过 。 因 为 let z=*x; 执行 的 是 move 语 义 ， 编 译 器 不 允许 我 
们 拒 x 指 同 的 内 容 move 出 来 ， 这 只 是 一 个 借用 而 已 。 如 果 人 允许 执行 这 样 
的 操作 ， 会 导致 原来 的 借用 指针 x 指 回 非 法 数据 。 但 是 我 们 知道 ， 我 们 
这 个 丽 数 整体 上 是 可 以 保证 安全 的 ， 因 为 我 们 把 x 指 同 的 内 容 move 出 来 
之 后 ， 会 用 其 他 的 正确 数据 填 回 去 ， 最 终 可 以 保证 函数 执行 完 之 后 ，x 
a °。 这 种 时 候 ， 我 们 就 需要 动用 unsafe 了 ， 代 码 
人 下: 


fn swap<T>(x: &mut T, y: &mut T) { 
unsafe { 
let mut t: T = mem: :uninitialized(); 
ptr::copy_nonoverlapping(&*x, &mut t, 1); 
ptr::copy_nonoverlapping(&*y, x, 1); 
ptr::copy_nonoverlapping(&t, y, 1); 


mem: :forget(t); 


代码 逻辑 的 意思 如 下 。 


首先 ， 我 们 依然 需要 一 个 作为 中 转 的 局 部 变量 。 这 个 局 部 变量 该 
怎么 倪 妨 化 呢 ? 其 实 我 们 不 希望 它 执行 初始 化 ， 
分 向 存 至 3 间 而 已 ， 它 里 面 的 内 容 蕊 上 就 会 被 覆盖 挥 ， 做 初始 化 是 浪费 
性 能 。 襄 且 ， 我 们 也 不 知道 用 什么 通用 的 办 法 初始 化 一 个 泛 型 类 型 ， 
它 连 Default 约 束 都 未 必 满 足 。 所 以 我 们 要 用 mem: : uninitialized 苑 
pi o 


接 下 来 ， 我 们 可 以 直接 通过 内 存 复制 来 区 换 两 个 变量 。 因 为 在 Rust 
中 ， 所 有 的 类 型 、 所 有 的 move 操 作 ， 痢 是 商 单 的 内 存 复制 ， 不 涉及 其 
他 的 语义 。Rust 语 言 已 经 假定 任何 一 个 类 型 的 实例 ， 随 时 都 可 以 被 


move 到 另外 的 地 方 ， 不 会 产生 任何 问题 。 所 以 ， 我 们 可 以 直接 使 用 
ptr: : copy 系 列 函 数 来 完成 。 再 加 上 在 safe 代 人 码 中 ，&mnut 型 指针 有 具有 
排他 性 ， 我 们 可 以 确信 ，x 和 y 一 定 指 回 不 同 的 变量 。 所 以 可 以 使 用 
ptr: : copy_nonoverlapping 国 数 ， 比 ptr: : copy 要 快 一 点 。 


最 后 ， 一 定 要 记得 ， 要 阻止 临时 的 局 部 变量 (执行 析 构 函数 。 因 为 t 
本 喘 并 未 被 合理 地 初始 化 ， 它 内 部 的 值 是 直接 通过 内 存 复制 获得 的 。 
在 复制 完成 后 ， 它 内 部 的 指针 (如 果 有 的 话 ) 会 和 y 指 向 的 变量 是 相同 
的 。 如 琳 我 们 不 阻止 它 ， 那 么 在 函数 结束 的 时 候 它 的 析 构 函数 整 会 被 
目 动 调用 ， 这 样 y 指 癌 的 变量 就 变 成 非法 的 了 。 


这 样 我 们 才能 正确 地 完成 这 个 功能 。 虽 然 源 代码 看 起 来 比较 长 ， 
但 是 实际 生成 的 代码 并 不 多 ， 就 是 3 次 内 存 块 的 复制 。 假 设 执行 的 时 候 
沁 型 参数 T 被 实例 化 为 Vec<i32>， 这 个 swap 男 数 的 执行 流程 如 图 19-1 所 


修 ° 


在 新 版 本 的 标准 库 的 源码 中 ， 做 法 比 这 个 更 复杂 ， 主 要 是 为 了 更 
好 地 优化 执行 效率 。 它 并 没有 在 内 存 中 分 配 一 个 临时 对 象 ， 而 是 尽 可 
能 利用 寄存 絮 做 数据 交换 。 具 体 细 市 束 不 展开 了 ， 大 家 可 以 目 己 去 读 
源码 ， 上 自己 尝试 做 性 能 测试 。 


图 19-1 ( 


洪 


) 


分 割 信用 


“aliastmutation” 规 则 非常 有 用 


19.4 


"然而 ，alias 分 析 在 碰 到 复合 数据 


类 型 的 时 候 也 会 非常 无 对。 我 们 看 看 下 面 的 示例 : 


struct Foo { 
a: i32, 
b: i32, 
c: i32, 
} 


fn main() { 
let mut x = Foo fa: 
let pa = &mut x.a; 
let pb = &mut x.b; 
let pc = &x.c; 
“pb += 1; 
let pc2 = &x.c,; 
*pa 二 三 


0, b: 0, c: 0}; 


pa += 10; 
printin!("{} {} {} {}", pa, pb, pce, pe2); 


这 种 情况 ，Rust 编 译 右 可 以 愉快 地 通过 编译 ， 因 为 它 知道 ， 


Ei 


pa、pb、pc 分 别 指 回 的 是 不 同 的 内 存 区 域 ， 它 们 之 间 不 是 alias 关 系 ， 


所 以 这 些 指针 完全 可 以 共存 。 但 是 ， 


组 之 后 ， 情 况 惑 变 了 : 


fn main() { 
let mut x = [1 i32, 2, 3]; 
let pa = &mut x[0]; 
let pb = &mut x[1]; 
let pc = &x[2]; 
“pb += 1; 
let pc2 = &x[2]; 
*pa 十 二 


我 们 把 数据 类 型 从 结构 体 转 为 数 


p 10; 
printin!("{} {} {} {}", pa, pb, pce, pc2); 


这 上 段 代 码 所 做 的 事情 其 实 跟 上 面 一 段 代码 基本 一 样 。 编 译 ， 发 生 


错误 ， 错 误 信 息 为 : 


error: cannot borrow x[..]. 


as mutable more than once at a time 


这 时 候 ， Rust 编 详 右 判定 pa \`pb、pc 存 在 alias 关 系 。 它 没 办 法 搞 
清楚 &x[A]、 &x[B] 、 &xx[C] 之 间 是 否 有 可 能 有 重 登 。 为 什么 编译 需 没 
办 法 捅 清楚 它们 之 间 是 否 有 重合 呢 ? 


目 和 完 ， 要 堵 虑 到 实际 程序 中 作为 罕 引 的 变量 很 可 能 不 是 编译 期 党 
量 ， 而 是 根据 运行 期 的 值 决 是 ，A、B、C 可 以 是 任意 表达 式 。 


其 次 ， 索 引 操 作 运算 符 其 实 征 在 标准 库 中 实现 的 ， 除 了 数组 ， 还 
有 许多 类 型 也 能 文 持 索 引 操作 ， 比 如 HashMap。 即 便 编 译 硕 知道 了 
A、B、C 二 个 索引 没有 重 胎 ， 它 也 无 法 直接 推理 出 &x[A]、&x[B]、 
&x[C] 之 间 是 否 有 重合 。 两 个 不 同 字符 串 做 索引 实际 上 指向 了 同一 个 
值 也 有 可 能 。 


所 以 ， 对 于 结构 体 类 型 ， 编 译 器 可 以 很 轻松 地 知道 ， 指 癌 不 同 成 
员 的 指针 一 定 不 重 又 ， 而 对 于 数组 切片 ， 编 译 器 的 推理 结果 是 将 x[_] 
视 为 一 个 整体 ，&x[A]、&x[B]、&x[C] 之 间 都 算 重 于 。 虽 然 读 者 可 以 
看 出 来 ，&mnut x[0..2] 和 &mut x[3..4] 根 本 就 是 指向 两 块 独立 的 内 存 区 
域 ， 它 们 同时 存在 是 完全 安全 的 。 但 是 编译 器 却 觉得 ，&mut x[A] 和 
&mut x[B] 一 定 不 能 同时 存在 ， 否 则 就 违反 了 aliastmutation 的 设计 原 
则 。 


那么 面 对 这 样 的 情况 ，Rust 该 如 何 解 决 呢 ? 如 条 说 我 们 可 以 确定 
两 块 数组 切片 确实 不 存在 重合 ， 我 们 应 该 怎么 告诉 编译 事 呢 ? 


这 束 需 要 用 到 标准 库 中 的 split_at 以 及 split_at_mut 方 法 。 首 和 完 ， 我 
们 看 看 它 的 使 用 方式 : 


fn main() { 
let mut x = [1 i32, 2, 3]; 


let (first, rest) : (&mut [i32], &mut [i32]) = x.split_ at_mut(1); 
let (second, third): (&mut [i32], &mut [i32]) = rest.split at_mut(1); 
first[0] += 2) 

Second[0] += 4; 

third[0] += 8; 

println!i("{:?} {:?} {:?2}", first, second, third); 


} 
printlin!("{:2}", &x); 


执行 结果 为 : 


[3] [6] [11] 
[3，6，11] 


使 用 split_at_mnut 方 法 ， 可 以 将 一 个 Slice 切 分 为 两 个 部 分 返回 ， 返 
回 值 中 包括 的 两 个 值 分 别 都 是 指 问 原 Slice 的 &mut[T] 型 切片 。 这 样 可 
以 保证 这 两 个 数组 切片 一 定 不 会 发 生 重 达 ， 因 此 它们 可 以 同时 存在 两 
个 &mut 型 指针 ， 同 时 修改 原来 的 数组 ， 而 不 会 制造 内 存 不 安全 。 


那么 split_at_mut 方 法 内 部 实现 是 怎么 做 的 呢 ? 它 的 源码 如 下 所 
可 SS 


#[inline] 

fn split at mut(&mut self, mid: usize) -> (&mut [T], &mut [T]) { 
let len = self.len(); 
let ptr = self.as mut_ptr(); 


unsafe 区 
assert!(mid <= len); 


(from_raw_ parts_ mut(ptr, mid), 
from_raw_parts_mut(ptr,offset(mid as isize), len - mid)) 
} 
} 


整体 的 逻辑 并 不 复杂 ， 只 是 需要 一 点 unsafe 代 码 来 辅助 。 这 说 
明 ，Rust 的 这 套 alias+tmutation 规 则 ， 虽 然 威力 巨大 ， 但 也 误伤 了 一 
些 * 好 人 ”。 存 在 一 些 情 况 是 ， 实 际 上 内 存 安 全 但 是 无 法 被 编译 器 接 
爱 。 面 对 这 样 的 情况 ， 我 们 可 以 利用 Rust 的 unsafe 代 码 ，case by case 地 
解决 问题 。 


另外 需要 强调 的 是 ，unsafe 一 定 不 能 小 用。 应 该 尽量 把 unsafe 代 码 
封装 在 一 个 较 小 的 范围 ， 对 外 公开 的 是 完全 safe 的 API。 如 果 不 懂得 如 
何 抽象 ， 把 unsafe 散 落 在 业务 逻辑 的 各 个 角落 中 ， 那 么 这 就 相当 于 退 
化 成 了 C 语 言 ， 甚 至 更 糟糕 。 


还 需要 特别 强调 的 一 点 是 ， 用 户 更 加 不 要 做 目 欺 欺 人 的 事情 ， 把 
一 个 明明 是 unsafe 的 函数 声明 成 普通 辑 数 ， 仅 仅 为 了 调用 的 时 候 稍微 
方便 一 点 。 请 大 家 一 定 要 注意 如 来 一 个 函数 有 可 能 在 某 些 场 景 下 市 
造 出 内 存 不 安全 ， 那 么 它 必 须 用 unsafe 标 记 ， 不 能 偷懒 。 哪 怕 这 个 可 
能 性 微乎其微 也 不 行 。 在 调用 unsafe 范 数 的 地 方 ， 调 用 者 必须 反复 确 


认 被 调用 的 这 个 unsafe 函 数 的 前 置 条 件 和 后 置 条件 是 否 满足 
单 地 用 unsafe 代 码 块 框 起 来 。 


19.5” 协 变 


19.5.1 什么 是 协 变 


Rust 的 生命 周期 参数 是 一 种 泛 型 类 型 参数 。 比 如 ， 我 们 可 以 这 样 
理解 共 至 引用 : 


type StrRef<'a> = &'a str,; 


这 是 一 个 指向 字符 串 的 借用 指针 。 它 是 一 个 泛 型 类 型 ， 接 受 一 个 
泛 型 参数 ， 之 后 形成 一 个 完整 类 型 。 它 跟 Vec<T> 很 像 ， 只 不 过 Rust 里 
面 泛 型 类 型 参数 由 有 生命 周期 ， 又 有 普通 类 型 。 下 面 是 一 个 示例 : 


type StrRef<'a> = &'a str,; 
fn print_str<'b>(s: StrRef<'b>) { 
println!("{}", s); 


fn main() { 
let s : StrRef<'static> = "hello"; 
print_str(s); 


} 


这 个 例子 中 演示 了 一 种 有 意思 的 现象 。 大 家 看 一 下 ，print_str 接 受 
的 参数 类 型 是 Str-Ref<b>， 而 实际 上 传 进 来 的 参数 类 型 是 
StrRef<'static>， 这 两 个 类 型 并 不 完全 一 致 ， 因 为 b! ='static。 但 是 Rust 
可 以 接受 。 这 种 现象 在 类 型 系统 中 被 称 为 “ 协 变 ” (covariance) 和 “ 逆 
变 ”(contravariance) 。 

协 变 和 逆 变 的 定义 如 下 。 我 们 用 <: 符号 记录 子 类 型 关系 ， 对 于 
沁 型 类 型 C<T>， 


- 协 变 


若 T1<: T2 时 满足 C<T1><: C<T2>， 则 C 对 于 参数 TI 是 协 变 关系 。 


若 T1<: T2 时 满足 C<T2><: C<T1>， 则 C 对 于 参数 T 是 逆 变 关系 。 

:不 变 

上 述 两 种 都 不 成 立 。 

总 结 起 来 就 是 ， 如 果 类 型 构造 器 保持 了 参数 的 子 类 型 关系 ， 就 是 
协 变 ， 如 果 逆 转 了 参数 的 子 类 型 关系， 就 是 逆 变 。 其 他 情况 ， 就 是 不 


变 。 


Rust 不 文 持 普 通 泛 型 参数 类 型 的 协 变 和 选 变 ， 只 对 生命 周期 泛 型 
参数 存在 协 变 和 逆 变 。 


在 Rust 中 ， 泛 型 类 型 支持 针对 生命 周期 的 协 变 是 一 个 重要 功能 。 
大 家 试想 一 下 ， 下 面 这 条 语句 为 什么 能 成 立 : 


let s : &str = "hello"; 


"hello" 是 一 个 字符 串 字 面 量 ， 它 的 类 型 是 &'static str。 而 s 是 一 个 局 
部 变量 ， 它 的 类 型 是 &'s str。 其 中 泛 型 参数 在 源码 中 省 略 挥 了 ， 这 个 
生命 周期 沁 型 参数 代表 的 是 这 个 局 部 变量 从 声明 到 结束 的 这 上 段 区 域 。 
在 这 人 句 话 中 ， 我 们 把 一 个 生命 周期 更 长 的 引用 &'static sr， 赋 值 给 了 一 
个 生命 周期 更 短 的 引用 &'a str， 这 是 没 问题 的 。 原 因 在 于 ， 既 然 这 边 
被 指 问 的 目标 在 更 长 生命 周期 内 都 是 合法 的 ， 那 么 它 在 一 个 较 短 生命 
周期 内 也 一 定 是 合法 的 。 所 以 ， 我 们 可 以 说 引用 类 型 & 对 生命 周期 参 
数 具有 协 变 关系 。 (此 处 有 些 争 论 ， 有 人 认为 这 里 应 该 理解 为 逆 变 关 
系 ， 主 要 的 争议 来 目 于 我 们 很 难说 清 两 个 生命 周期 ， 究 竟 准 是 准 的 子 
类 型 。 本 书 中 为 了 行文 的 方便 ， 继 续 使 用 * 协 变 ”， 但 主要 意思 是 “ 协 变 
or 逆 变 ”， 是 跟 “ 不 变 ” 的 概念 相对 立 的 。) 


接 下 来 ， 我 们 可 以 通过 一 些 示 例 继续 理解 其 他 一 些 泛 型 类 型 的 协 
变 关系 。 示 例如 下 : 


fn test<'a>(s : 
let local : 
} 


static str) { 


&'a &! 
&'a &'a str = s; 


从 这 个 示例 我 们 可 以 看 到 ，&'a &z'static str 类 型 可 以 安全 地 赋值 给 
&'a &'a str 类 型 。 由 于 &'static str<: &'a str 以 及 &a R'static str<: &'a &'a 
str 关 系 成 立 ， 这 说 明 引 用 类 型 和 针对 泛 型 参数 T 也 是 具备 协 变 关系 的 。 


把 上 面 的 示例 改 一 下 ， 试 试 &a mut T 型 指针 : 


fn test<'a>(s : &'a mut &'static str) { 
let local : &'a mut &'a str = s; 
} 


编译 ， 可 见 出 现 了 生命 周期 错误 。 这 说 明 从 &'a mut &'static str 类 
型 到 &'a mut &'a str 类 型 的 转换 是 不 安全 的 。 此 事 可 以 说 明 ，&mut 型 指 
针对 泛 型 T 参 数 是 不 变 的 。 


下 面 再 试 试 Box 类 型 : 


fn test<'a>(s : Box<&'static str>) { 
let local : Box<&'a str> = s; 
} 


这 上 段 代码 可 以 编译 通过 ， 说 明 从 Box<&'static str> 类 型 天 Box<&'a 
str> 类 型 的 转换 是 安全 的 。 所 以 Box<T> 类 型 针对 T 参 数 是 具备 协 变 关 
系 的 。 


下 面 再 试 试 贸 数 各 类 型 。 注 意 名 类 型 有 两 个 地 方 可 以 使 用 泛 型 参 
数 ， 一 个 是 参数 那里 ， 一 个 是 返回 值 那里 。 我 们 写 两 个 测试 用 例 : 


fn test_arg<'a>(f : fn(&'a str)) { 
let local : fn(&'static str) = f; 
} 


fn test_ret<'a>(f : fn()->&'a str) { 
let local : fn()->&'static str = 
} 


test_arg 可 以 通过 编译 ，test_ret 不 能 通过 。 意 思 是 ,fn (&r'a str) 
类 型 可 以 转换 为 mn (&z'static str) 类 型 ， 而 人 () ->&x'a str 类 型 不 能 转换 
为 f () ->&'static str 类 型 。 这 意味 着 类 型 fm (T) ->U 对 于 泛 型 参数 T 


具备 协 变 关 系 ， 对 于 U 不 具备 协 变 关 系 。 如 果 我 们 把 这 个 测试 改 一 
下 ， 笑 试 把 生命 周期 参数 换个 位 置 : 


fn test_ret<'a>(f : fn()->&'a str) { 
f(); 
} 


fn main() { 
fn s() -> &'static str { return ""; } 


test_ret(s); 


上 面 这 段 代码 可 以 编译 通过 。 这 意味 着 fn () ->&'static str 类 型 可 
以 安全 地 转换 为 血 〈) ->&'a str 类 型 。 那 我 们 可 以 说 ， 类 型 ma (T) ->U 
对 于 参数 U 具 备 逆 变 关系 。 


再 换 成 具备 内 部 可 变性 的 类 型 试验 : 


use std::cell::Cell; 


fn test<'a>(s : Cell<&'static str>) { 
let local : Cell<&'a str> = s; 
} 


编译 出 现 了 生命 周期 不 匹配 的 错误 。 这 说 明 Cell<T> 类 型 针对 T 参 
数 不 具 备 协 变 关系 。 至 于 为 什么 要 这 样 设计 ， 前 面 已 经 讲 过 了 ， 如 来 
具备 内 部 可 变性 的 类 型 还 有 生命 周期 协 变 关系 ， 可 以 构造 出 巧 空 指针 
的 情况 。 所 以 需要 编译 带 提 供 的 UnsafeCell 来 表达 针对 类 型 参数 具 
备 “ 不 变 ” 头 系 的 沁 型 类 型 。 


同样 ， 我 们 可 以 试 试 襟 指针 : 


fn test<'a>(s : *mut &'static str) { 
Jet local : *mut &'a str = s,; 


} 


可 以 得 出 结论 ，*const T 针 对 T 参 数 具 备 协 变 关系， 而 *mut T 针 对 
TI 参 数 是 不 变 关 系 。 比 如 标准 库 里 面 的 Box<T>。 它 的 内 部 包含 了 一 个 
裸 指针 ， 这 个 裸 指 针 就 是 用 的 *const T 而 不 是 *mut T。 这 是 因为 我 们 希 
望 Box<T> 针 对 T 参 数 具备 协 变 关系， 而 *mut T 无 法 提供 。 


在 写 unsafe 代 码 的 时 候 ， 特 别 是 涉及 沁 型 的 时 候 ， 往 往 需 要 我 们 
手动 告诉 编 详 带 ， 这 个 类 型 的 泛 型 参数 究竟 应 该 是 什么 协 变 关系 。 很 
多 情况 下 ， 我 们 需要 使 用 PhantomData 类 型 来 表达 这 个 信息 。 


19.5.2 PhantomData 


在 写 unsafe 代 码 的 时 候 ， 我 们 经 冲 会 磁 到 一 种 情况 ， 那 束 是 一 个 
类 型 是 市 有 生命 周期 参数 的 ， 它 表达 的 是 一 种 借用 关系 。 可 是 它 内 部 
征用 襟 指针 实现 的 。 请 注意 ， 裸 指针 是 不 市 生命 周期 参数 的 。 于 是 殉 
发 生 了 下 面 这 样 的 情况 : 


struct Iter<'a, T: 'a> { 
ptr: *const T, 
end: *const TT, 


} 


然而 ， 在 Rust 中 ， 如 果 一 个 类 型 的 沁 型 参数 从 来 没有 被 使 用 过 ， 
那么 就 是 一 个 编译 错误 。 请 参考 RFC 0738-variance。 如 果 一 个 沁 型 参 
数 从 来 没有 使 用 过 ， 那 么 编译 器 就 不 知道 这 个 泛 型 参数 对 于 这 个 类 型 
是 否 具 备 协 变 逆 变 关 系 ， 那 么 就 可 能 在 生命 周期 分 析 的 时 候 做 出 错误 
的 结论 。 所 以 编译 器 禁止 未 使 用 的 泛 型 参数 。 在 这 种 情况 下 ， 我 们 可 
以 使 用 PhantomData 类 型 来 告诉 编译 絮 协 变 逆 变 方面 的 信息 。 


PhantomData 没 有 运行 期 开销 ， 它 只 在 类 型 系统 层面 有 意义 。 比 
如 ， 一 个 目 定义 类 型 有 一 个 泛 型 参数 'a 没 有 被 使 用 ， 为 了 表达 这 个 类 
型 对 于 泛 型 参数 'a 具 备 协 变 关 系 ， 那 我 们 可 以 为 它 加 一 个 成 员 ， 并 量 
把 类 型 制定 为 PhantomData<'aT> 即 可 。 因 为 前 面 我 们 已 经 说 了 &'a 了 T 类 
型 对 于 泛 型 参数 'a 具 备 协 变 关系 ， 所 以 编译 器 就 可 以 推理 出 来 这 个 卓 
定义 类 型 对 于 泛 型 参数 'a 具 备 协 变 关 系 。 其 他 用 法 与 此 类 似 ， 你 要 表 
达 一 个 什么 样 的 协 变 逆 变 关系 ， 就 找 一 个 现存 的 类 似 的 类 型 ， 拿 它 当 
作 PhantomData 的 沁 型 参数 即 可 。 


PhantomData 定 义 在 std: : marker 模 块 中 : 


#[lang = "phantom_data"] 
#[stable(feature = "rust1", since = "1.0.0")] 
pub struct PhantomData<T:?Sized>; 


它 是 一 个 0 大 小 的 、 特 殊 的 泛 型 类 型 。 它 上 面 有 #[lang=.….] 属 性 标 
记 ， 这 说 明 它 是 编译 絮 特 殊 照 顾 的 类 型 。 它 主要 十 用 于 写 unsafe 代 码 
时 ， 告 诉 编译 右 这 个 类 型 的 语义 信息 。 


如 有 果 你 想 表 达 这 个 类 型 对 T 类 型 成 员 有 拥有 关系 ， 那 么 可 以 使 用 
PhantomData<T>。 例 如 std: : core: : ptr: : Unique: 


pub struct Unique<T: ?Sized> { 
pointer: NonZero<*const T>, 
_marker: PhantomData<T>, 


} 


如 有 果 你 想 表 达 这 个 类 型 对 T 类 型 成 员 有 借用 关系 ， 那 么 可 以 使 用 


PhantomData<&'a IT>° 


你 还 可 以 用 它 来 表明 当前 这 个 类 型 不 可 Send、Sync， 示 例如 下 : 


struct MyStruct { 
data: String, 
_marker: PhantomData<*mut ()>, 


} 


下 面 同样 用 比较 完整 的 示例 来 演示 一 下 这 个 类 型 的 具体 作用 。 假 
设 我 们 现在 有 两 个 类 型 : 


use std::fmt::Debug; 


#[derive(Clone, Debug)] 
struct Ss,; 


#[derive(Debug)] 


Struct R<T: Debug> { 
x: *const T 
} 


其 中 R 类 型 想 表 达 一 种 借用 关系 ， 它 内 部 需要 用 裸 指针 实现 。 上 
0 


fn main() { 
let mut r = R{ x: std::ptr::null() }; 


let local = S{}; 
r.x = &local,; 


// r.x now is dangling pointer 


} 


为 了 让 编译 器 使 用 borrow checker 检 查 这 种 内 存 错误 ， 我 们 可 以 给 
R 类 型 添加 一 个 生命 周期 参数 ， 并 且 利 用 PhantomData 使 用 这 个 生命 周 
期 参数 ， 避 免 “ 未 使 用 泛 型 参数 "的 错误 。 同 时 给 R 类 型 增加 一 个 成 员 
方法 ， 在 成 员 方 法 中 改变 指针 的 地 址 ， 并 且 通 过 模块 系统 禁止 外 部 用 
户 直 接 访问 R 的 内 部 成 员 。 完 整 代码 如 下 所 示 : 


use std::fmt::Debug; 
use std::ptr: :null,; 
use std::marker::PhantomData; 


#[derive(Clone, Debug)] 
struct Ss; 


#[derive(Debug)] 

struct R<'a, T: Debug + 'a> { 
x: *const T, 
marker: PhantomData<&'a T>, 


impl<'a, T: Debug> Drop for R<'a, T> { 
fn drop(&mut self) { 
unsafe { printin!("Dropping R while S {:?}", *self.x) } 
} 
} 


impl<'a, T: Debug + 'a> R<'a, T> { 
pub fn ref_to<'b: 'a>(&mut self, obj: &'b T) { 
self.x = obj; 


fn main() { 
let mut r = R { x: null(), marker: PhantomData }; 


let local = Sf{ }; 
r.ref_to(&local),; 


再 编译 ， 我 们 可 以 看 到 ， 这 次 编译 铬 束 可 以 成 功 发 现 生 命 周期 错 
误 ， 禁 止 悬 挂 指针 的 产生 。 在 写 FFI 给 C 代 码 做 封装 的 时 候 ， 需 要 经 常 
使 用 裸 指针 ， 这 时 就 可 以 用 类 似 的 技巧 来 处 理 生命 周期 的 问题 。 


19.6 ”未 定义 行为 


在 C/C++ 等 语言 中 ， 未 定义 行为 (undefined behavior， 人 简称 UB) 
指 的 是 ， 在 某 些 情况 下 语言 标准 允许 编译 右 做 任何 事情 ， 无 论 发 生 什 
么 后 果 都 是 正常 的 ， 不 属于 编译 絮 的 bug。 比 如 ， 对 空 指 针 做 “ 解 引 
J 在 C/C++ 里 面 就 是 未 定义 行为 ， 编 译 避 可 以 决定 做 任何 事 
情 。 


在 C/C++ 标准 里 面 ， 很 多 情况 下 ， 都 有 充分 的 理由 将 某 些 行为 定 
义 为 UB， 这 是 语言 本 里 的 定位 决定 的 。 它 可 以 人 简化 编译 器 的 设计 ， 也 
可 以 最 大 化 执行 效率 ， 还 可 以 最 大 化 跨 平 台 ， 等 等 。 但 是 我 们 也 应 该 
承认 ， 过 多 的 UB 是 对 用 户 极其 不 友好 的 。 在 Rust 里 面 ，UB 被 限制 在 
了 一 个 较 小 的 范围 内 ， 只 有 unsafe 代 码 有 可 能 制造 出 UB， 这 也 是 在 写 
unsafe 代 码 的 时 候 需 要 注意 的 。 

下 面 列 举 一 些 undefined behavior， 摘 抄 自 Rust 的 Reference 文 档 : 

数据 竞争 

: 解 引 用 空 指 针 或 者 基 空 指针 

-使 用 未 对 齐 的 指针 读 写 内 存 而 不 是 使 用 read_unaligned 或 者 


write_unaligned 
读 取 未 初始 化 内 存 
破坏 了 指针 别名 规则 
.通过 共享 引用 修改 变量 (除非 数据 是 被 UnsafeCell 包 于 的 ) 
调用 编译 需 内 置 函 数 制 造 UB 
给 内 置 类 型 赋予 非法 值 
给 引用 或 者 Box 赋 值 为 空 或 者 巧 空 指针 
给 bool 类 型 赋值 为 0 和 1 之 外 的 数字 


-给 enum 类 型 赋予 类 型 定义 之 外 的 tag 标 记 
.给 char 类 型 赋予 超过 char: : MAX 的 值 
给 str 类 型 赋予 非 utf-8 编 码 的 值 


以 上 只 是 一 些 典 型 的 问题 ， 完 整 列 表 请 大 家 参考 官方 文档 。 这 些 
R20 0 候 出 更， 这 都 和 需要 读者 注意 的 地 
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Rnust 的 unsafe 天 键 字 是 一 个 难点 ， 也 是 很 多 初学 者 困惑 的 地 方 。 很 
多 人 有 这 样 的 疑惑 : 既然 Rust 人 允许 使 用 unsafe 来 完成 许多 危险 的 操作 ， 
那么 Rust 的 安全 性 保证 是 不 是 职 没 什么 意义 了 ? 


这 件 事情 不 能 这 么 理解 。unsafe 的 存在 不 是 来 故意 破坏 安全 性 
的 ， 它 只 是 一 种 面 癌 更 底层 操作 的 接口 。 不 同 的 高 级 语言 对 于 什么 是 
底层 的 定义 是 不 同 的 ， 但 是 所 有 的 高 级 语言 ， 只 要 不 断 往 底 层 探 究 ， 
总 会 储 到 safe 与 unsafe 之 间 的 分 界线 。 比 如 ，Java 有 上 自己 的 JNI 机 制 ， 
C# 也 有 unsafe 关 键 字 ，Python 也 可 以 调用 C 模 块 ， 甚 至 C/C++ 语 言 都 可 
以 内 瞬 汇 编 。 当 你 在 高 级 语言 中 与 确 层 操作 交互 的 时 候 ， 必 须 确 保 高 
级 语言 中 的 一 些 规 则 和 约定 。Java、C## 文 类 语言 ， 利 用 GC 实现 了 内 存 
安全 ， 但 是 用 户 同样 可 以 使 用 JNI/unsafe 实 现 不 安全 的 操作 ， 但 这 件 事 
情 并 不 意味 着 Java、C# 语 言 本 刁 有 安全 性 缺陷 。 同 理 ， 在 C 语 言 里 面 
用 内 骨 汇 编 搞 乱 了 堆栈 ， 也 不 能 说 是 C 语 言 的 设计 缺陷 。 只 不 过 是 用 
户 使 用 这 些 机 制 的 时 候 ， 没 有 一 个 自动 检查 工具 来 保证 安全 性 ， 而 是 
必须 由 自己 来 保证 上 层 代 码 和 下 层 代 码 之 间 交 互 的 正确 性 。 


Rnust 的 unsafe 最 大 的 问题 在 于 ， 到 目前 为 止 ， 依 然 没 有 一 份 官方 文 
档 来 明确 哪些 东西 是 用 户 可 以 依赖 的 、 哪 些 是 编译 姻 实 现 相 关 的 、 哪 
些 是 以 后 永远 不 变 的 、 哪 些 是 将 来 可 能 会 有 变化 的 。 所 以 ， 哪 怕 用 户 
能 确保 目 己 写 出 来 的 unsafe 代 码 在 目前 版 本 上 是 完全 正确 的 ， 也 没 办 
法 确保 不 会 在 以 后 的 版 本 中 出 问题 。 如 果 以 后 编译 器 的 实现 发 生 了 变 
人 化， 导致 了 unsafe 代 码 无 法 正常 工作 ， 究 竟 算 是 编译 絮 的 bug 还 是 用 户 
错误 地 依赖 了 某 些 特性 ， 还 说 不 清楚 。 正 式 的 unsafe guideline 还 在 继 
续 编写 过 程 中 。 (当然 这 种 错误 情况 几率 是 很 低 的 ， 绝 大 多 数 用 户 使 
i 不 会 涉及 那些 精微 细密 的 语义 规 
则 。 


我 们 既 不 能 过 于 滥用 unsafe， 也 不 该 对 它 心 怀 芍 避 。 它 只 是 表 
明 ， 某 些 代 码 的 安全 性 依赖 于 某 些 条 件 ， 而 我 们 无 法 清晰 地 在 代码 中 
表达 这 些 约束 条 件 ， 因 此 无 法 由 编译 器 帮 我 们 目 动 检查 。 


unsafe 是 Rust 的 一 块 重要 拼图 ， 充 分 理解 unsafe 的 意义 和 作用 ， 才 
能 让 我 们 更 好 地 理解 safe 的 来 源 和 可 贵 。 


孙子 兵法 


不 尽 知 用 兵 之 害 者 ， 则 不 能 尽 知 用 兵 之 利 也 。 


第 20 章 ”Vec 源 码 分 析 


本 广 将 通过 一 个 比较 完整 的 例子 ， 把 内 存 安全 问题 分 析 一 这。 本 
市 选择 的 例子 是 标准 库 中 的 基本 数据 结构 Vec<T> 源 代码 分 析 。 之 所 以 
选择 这 个 模块 作为 示例 ， 其 一 是 因为 这 个 类 型 作为 非常 基础 的 数据 结 
构 ， 平 时 用 得 很 多 ， 大 家 都 很 熟悉 ， 第 二 个 原因 是 ， 恰 好 它 的 内 部 实 
现 又 完全 展现 了 Rust 内 存 安 全 的 方方面面 ， 深 入 剖析 它 的 内 部 实现 非 
常 有 利于 加 深 我 们 对 Rust 内 存 安 全 的 认识 。 本 章 中 用 于 分 析 的 代码 十 
1.23 nightly 版 本 ，Vec 的 内 部 实现 源码 在 此 之 前 一 直 有 所 变化 ， 以 后 也 
很 可 能 还 会 有 变化 ， 请 读者 注意 这 一 点 。 


我 们 先 从 使 用 者 的 角度 分 析 一 下 Vec 是 如 何 自动 管理 内 存 空间 的 : 


fn main() { 
Jet mut v1 = Vec::<i32>: :new(); 
println!("Start: length {} capacity {}", vi.len(), vi.capacity()); 


for i in 1..10 { 
v1i.push(1); 
println!("[Pushed {}] length {} capacity {}", i, vi.len(), 
vi.capacity()); 
} 


Jet mut v2 = Vec::<i32>::with_capacity(1); 
println!("Start: length {} capacity {}", v2.len(), v2.capacity()); 


v2 .reserve(10); 
for i in 1..10 { 
v2.push(1); 
println!("[Pushed {}] length {} capacity {}", i, v2.1len(), 
v2.capacity()); 
} 


} 


编译 ， 执 行 ， 从 结果 中 可 以 看 出 ， 如 果 用 new 方 法 构造 出 来 ， 
开始 的 时 候 是 没有 分 配 内 存 空间 的 ，capacity 为 0° 我 们 也 可 以 使 用 
with_capacity 来 构造 新 的 Vec， 可 以 目 行 指定 预 留 空 间 大 小 ， 还 可 以 对 
已 有 的 Vec 调 用 reserve 方 法 扩展 预 留 空间 。 在 回 容 髓 内 部 插入 数据 的 时 
修 ， 如 有 果 当 前 容量 不 够 用 了 ， 它 会 自动 申请 更 多 的 空间 。 当 变量 生命 
周期 结束 的 时 候 ， 它 会 目 动 释放 它 管理 的 内 存 空间 。 


20.1 内存 申 请 


首先 ， 我 们 知道 Vec 征 一 个 动态 数组 ， 它 会 根据 情况 动态 扩展 当前 
的 空间 大 小 。 在 Rust 以 及 C++ 这 样 的 语言 中 ， 动 态 数组 这 样 的 类 型 是 
由 库 来 实现 的 ， 而 不 是 像 某 些 带 GC 的 语言 一 样 由 运行 时 环境 内 置 提 
供 。 这 是 因为 Rust 和 C++ 一 样 ， 都 具备 对 内 存 的 直接 控制 力 ， 其 中 一 
个 表现 吏 和 是 ， 可 以 手动 调用 内 存 分 配 右 ， 目 己 管理 内 存 分 配 和 释放 的 
策略 。 动 态 数组 类 型 的 基本 思想 是 : 它 不 像 内 置 数 组 一 样 直接 把 数据 
保存 到 栈 上 ， 而 是 在 堆 上 开辟 一 块 空 间 来 保存 数据 ， 在 回 Vec 中 插入 数 
据 的 时 候 ， 如 采 当 前 已 分 配 的 空间 不 够 用 了 ， 它 会 重新 分 配 更 大 的 内 
存 空间 ， 把 原 有 的 数据 复制 过 去 ， 然 后 继续 执行 插入 操作 。 


在 日 前 版 本 的 标准 库 中 ，Vec 类 型 的 源码 存在 于 liballoc/vec.rs 文 件 
中 。 写 的 定义 很 简单 : 


pub struct Vec<T> { 
buf: RawVec<T>, 
len: usize, 


} 


它 只 有 两 个 成 员 : 一 个 是 RawVec<T> 类 型 ， 管 理 内 存 空 间 的 分 配 
和 释放 ; 另外 一 个 是 usize 类 型 ， 记 录 当 前 包含 的 元 素 个 数 。Vec 的 new 
和 capacity 方 法 都 很 简单 : 


pub fn new() -> Vec<T> { 
Vec { 


buf: RawVec: :new(), 
len: 0, 


pub fn with_capacity(capacity: usize) -> Vec<T> { 
Vec { 
buf: RawVec: :with_capacity(capacity), 
len: 0, 
} 
} 


我 们 继续 深入 查看 RawVec 这 个 类 型 的 new 和 capacity 方 法 是 如 何 实 
现 的 。 它 的 源码 在 liballoc/raw_vec.rs 文 件 中 : 


pub struct RawVec<T, A: Alloc = Heap> { 
ptr: Unique<T>, 
cap: usize, 
a: A, 

} 


impl<T> RawVec<T, Heap> { 
pub fn new() -> Self { 
Self: :new_in(Heap) 


} 
pub fn with_capacity(cap: usize) -> Self { 
RawVec: :allocate_in(cap, false, Heap) 


} 
} 


从 这 里 可 以 看 到 ，RawVec 的 泛 型 参数 比 Vec 多 了 一 个 ， 这 个 泛 型 
参数 代表 的 是 内 存 分 配器 allocator。 这 个 设计 的 目的 是 让 Rust 的 标准 容 
右 能 像 C++ 中 的 一 样 ， 可 以 由 用 户 目 行 指定 内 存 分 配 右 。 这 个 功能 目 
前 还 处 于 设计 过 程 中 ， 因 此 只 有 RawVec 中 有 这 个 功能 ， 而 Vec 还 没 
有 ， 以 后 Vec 同 样 也 会 有 这 样 一 个 泛 型 参数 的 。 这 个 泛 型 参数 有 一 个 默 
认 值 ， 叫 作 Heap ， 是 标准 库 给 我 们 提供 的 默认 内 存 分 配器 。 一 般 来 
说 ， 内 存 分 配器 都 是 0 大 小 的 类 型 ， 它 没有 任何 成 员 ， 不 保存 任何 状态 
信息 。 比 如 Heap 这 个 类 型 的 定义 : 


#[derive(Copy, Clone, Default, Debug)] 
pub struct Heap; 


继续 分 析 RawVec 的 new 方 法 。 它 调用 了 它 目 己 的 new_in 方 法 ， 并 
将 allocator 作 为 参数 传递 进去 。 因 为 Heap 类 型 没有 成 员 ， 所 以 它 可 以 
有 。 这 个 new_in 方 法 是 这 样 实 
岗 的 : 


pub fn new_ in(a: A) -> Self { 
// !0 is usize::MAX. This branch should be stripped at compile time. 
let cap = if mem::size of::<T>() == © { !0 } else {0 }; 


// Unique::empty() doubles as "unallocated" and "zero-sized allocation" 


RawVec { 
ptr: Unique: :empty(), 
cap, 
ay 

} 


} 


对 于 成 员 ptr 以 及 成 员 a， 都 是 简单 的 默认 构造 。 只 有 成 员 cap 的 处 
理 稍微 磋 烦 一 点 。 主 要 是 考虑 到 0 大 小 类 型 的 问题 ， 如 果 类 型 参数 TT 的 
大 小 是 0， 那 么 显然 Vec 即 便 不 申请 任何 内 存 ， 也 可 以 存 下 任意 多 的 T 
类 型 成 员 。 因 为 不 管 你 往 Vec 中 插入 多 少数 据 ， 总 大 小 依然 是 0。 所 以 
这 里 的 处 理 逻 辑 就 是 ， 当 size_of: : <T> () ==0 的 时 候 ，cap 的 取 值 
是 usize: : MAX。 这 里 的 ! 0 的 写法 ， 实 际 上 是 对 0 按 位 取 反 。 


再 回 看 RawvVec 的 with_capacity 方 法 。 它 调用 了 它 上 自己 的 allocate_in 
方法 。 这 个 方法 的 实现 如 下 所 示 : 


fn allocate_in(cap: usize, zeroed: bool, mut a: A) -> Self { 
unsafe { 
let elem size = mem::size of::<T>(); 


let alloc_ size = cap.checked mul(elem size).expect("capacity overflow"); 
alloc_guard(alloc_ size); 


// handles ZSTs and ‘cap = 0”alike 
let ptr = if alloc size == © { 
mem: :align_of::<T>() as *mut u8 
} else { 
let align = mem::align_of::<T>(); 
let result = if zeroed { 
a.alloc zeroed(Layout::from_ size align(alloc_ size, 
align).unwrap()) 
} else { 
a.alloc(Layout::from size align(alloc_ size, align).unwrap()) 


/ 
match result { 
Ok(ptr) => ptr, 
Err(err) => a.oom(err), 


}; 

RawVec { 
ptr: Unique: :new_unchecked(ptr as *mut _), 
cap, 
ay 

} 


} 
} 


首先 计算 需要 分 配 的 内 存 大 小 。 它 使 用 了 checked_mul 处 理光 出 问 
题 。 然 后 考虑 0 大 小 的 问题 。 此 时 无 须 调用 内 存 分 配 回 的 方法 ， 而 是 直 
接 返 回 一 个 数值 很 小 的 指针 〈 一 般 情 况 下 这 个 值 就 是 1) 。 为 了 有 利于 
编译 塘 后 端 优化 ， 这 个 指针 保证 了 与 T 类 型 字 节 对齐。 此 时 不 是 直接 
用 数值 0， 主 要 是 为 了 和 “ 空 指针 ”做 区 分 。 因 为 RawVec 已 经 假定 了 它 


的 成 员 ptr 永 远 不 会 是 空 指针 ， 所 以 它 用 了 Unique 类 型 。 这 种 设计 可 以 
让 Option<Vec<T>> 拥 有 和 Vec<T> 相 同 的 大 小 ， 而 无 须 浪 费 空 间 。 


最 后 我 们 再 来 分 析 一 下 RawvVec 里 面 的 ptr 成 员 。 它 是 Unique<T> 这 
个 类 型 。 这 个 类 型 的 定义 如 下 : 


pub struct Unique<T: ?Sized> { 
pointer: NonZero<*const T>, 
_marker: PhantomData<T>, 


} 


这 个 类 型 是 在 裸 指针 基础 上 做 了 一点 封装 。 


' 它 通过 PhantomData<T> 方 式 ， 回 编译 需 表 达 了 “ 它 是 IT 类 型 对 象 的 
拥有 者 ”这 样 一 个 概念 。PhantomData 这 个 类 型 是 一 个 0 大 小 的 、 被 编译 
佛 特 殊 对 待 的 类 型 ， 它 有 一 个 attribute 做 修饰 #[lang="phantom_data"]， 
凡是 被 #[lang=.….] 修 饰 的 东西 ， 都 是 被 编译 右 特 殊 处 理 的 ， 跟 普通 用 户 
目 己 定义 的 不 一 样 。 


:因为 从 逻辑 上 说 这 个 指针 不 应 该 为 空 ， 因 此 它 使 用 NonZero 做 了 
一 个 包装 。NonZero 这 个 类 型 也 是 一 个 特殊 类 型 ， 它 也 有 一 个 attribute 
是 #[lang="non_zero"]。 在 编译 絮 内 部 ， 会 认为 这 个 类 型 的 取 值 永远 不 
可 能 为 0°。 这 样 在 某 些 情况 下 ， 编 译 器 可 以 根据 这 个 信息 优化 存储 空 
间 。 比 如 Option<Box<T>> 占 据 的 空间 大 小 跟 Box<T> 束 一 模 一 样 ， 无 
的 至 间 ， 这 里 的 关键 就 是 Box<T> 内 部 也 使 用 了 NonZero 这 个 类 
型 o 


.Unique<T> 还 实现 了 Send 和 Sync 这 两 个 trait。unsafe impl<T': 
Send+? Sized>Send for Unique<T>{}unsafe impl<T: Sync+? 
Sized>Sync for Unique<T>{} 


标准 库 中 很 多 底层 的 数据 结构 都 需要 基于 裸 指针 ， 使 用 unsafe 代 
码 才 能 实现 。 而 很 多 数据 结构 都 需要 表达 一 种 “对 成 员 拥 有 所 有 权 ” 这 
样 一 个 概念 ， 因 此 它们 有 一 些 共同 的 代码 可 以 复 用 。 这 残 是 为 什么 
RawVec 和 是 基于 Unique 类 型 而 不 是 直接 基于 裸 指针 来 实现 的 原因 。 因 为 
抽象 出 的 这 样 一 个 Unique 类 型 ， 不 止 在 实现 动态 数组 的 时 候 有 用 ， 还 
可 以 在 实现 Box<T>HashMap<K，V> 等 类 型 的 时 候 有 用 。 


与 之 对 应 的 ， 标 准 库 中 还 有 一 个 叫 作 Shared<T> 的 类 型 。 它 也 是 在 
裸 指针 基础 上 做 了 一 点 封装 。 它 跟 Unique<T> 之 间 的 主要 区 别 在 于 ， 
Shared<T> 适 合用 于 表达 那 种 “共享 所 有 权 的 引用 ”的 情况 。 比 如 
Rc<T>Arc<T>LinkedList<T> 等 类 型 ， 都 是 基于 Shared<T> 实 现 的 。 


20.2 ”内 存 扩容 


可 接 下 来 我 们 分 析 一 下 Vec: : push 这 个 方法 是 如 何 实现 的 。 源 码 如 


pub fn push(&mut self, value: T) { 
If self.len == self.buf.cap() { 
self.buf.double( ); 


unsafe 区 
let end = self.as mut_ptr().offset(self.len as isize); 
ptr::write(end, value); 
self.len += 1; 
} 
} 


首先 判断 当前 是 否 还 有 至 余 容 量 ， 如 有 果 不 够 ， 束 调用 RawVec 的 
double 方 法 ， 如 采 足 够 ， 直 接 走 下 面 的 逻辑 。 接 下 来 殉 是 把 数据 插入 
Vec 的 做 法 。 这 里 直接 使 用 了 ptr: : write 方法 ， 它 做 的 事情 其 实 就 是 
简单 地 把 数据 按 位 复制 到 目标 位 置 。 请 注意 ， 在 Rust 中 这 么 做 是 完全 
正确 的 ， 因 为 它 没有 “复制 构造 画 数 ”移动 构造 国 数 ”“ 复 制 运 算 符 重 
载 "之 类 的 东西 ， 如 采 我 们 要 把 一 个 对 象 move 到 男 外 一 个 地 方 ， 那 束 
只 需要 把 这 个 对 象 按 位 复制 到 目的 地 址 即 可 。 当 然 我 们 还 要 防止 对 象 
ee 恰好 ptr: : write 方法 可 以 满足 这 个 要 


接 下 来 继续 看 一 下 RawVec: : double 方 法 是 怎么 实现 的 : 


pub fn double(&mut self) { 
unsafe { 
let elem size = mem::size of::<T>(); 


let (new cap, uniq) = match self.current_ layout() { 
Some(cur) => { 

let new cap = 2 * self.cap; 

Jet new_size = new cap * elem size; 

let new_ layout = Layout::from size align_ unchecked(new_ size, cur. 

align()); 

alloc_ guard(new size); 

let ptr_res = self.a.realloc(self.ptr.as_ptr() as *mut u8, 
cur, 
new_layout); 

match ptr_res { 

Ok(ptr) => (new_cap, Unique: :new_ unchecked(ptr as *mut T)), 


Err(e) => self.a.oom(e), 


None => { 
let new cap = if elem size > (!0) /8{1} else{ 4}; 
match self.a.alloc array::<T>(new cap) { 
Ok(ptr) => (new_cap, ptr), 
Err(e) => self.a.oom(e), 


} 
}; 
Self,ptr = uniq; 
self.cap = new_cap,; 
} 
} 


其 中 RawVec: : current_layout 方 法 的 实现 如 下 : 


fn current_layout(&self) -> Option<Layout> { 
If self.cap == © { 
None 
} else { 
unsafe 区 
let align = mem::align_of::<T>(); 
let size = mem::size of::<T>() * self.cap; 
Some(Layout: :from_ size_align_ unchecked(size, align)) 


} 


由 此 可 见 ， 如 果 当 前 capacity 是 0， 即 一 开始 用 Vec: : new () 方 
法 初始 化 的 情况 下 ， 新 的 容量 一 般 设置 为 4， 除 非 这 个 元 素 特 别 大 。 对 
于 当前 capacity 不 是 0 的 情况 ， 会 调用 allocator 的 realloc 方 法 ， 申 请 一 个 
两 倍 于 当前 大 小 的 空间 。 


20.3 内存 释放 
20.3.1 Vec 的 析 构 函数 


在 Rust 中 ，RAII 手 法 是 非常 常用 的 资源 管理 方式 。Vec 束 是 利用 
Se 。 因此 ， 接 下 来 我 们 需要 分 析 Vec 的 析 构 男 
RX: 


unsafe impl<#[may_dangle] T> Drop for Vec<T> { 
fn drop(&mut self) 区 
unsafe 区 
// use drop for [T] 
ptr::drop_in place(&mut self[..]); 


// RawVec handles deallocation 


} 
} 


目前 版 本 的 Vec， 在 impl Drop trait 的 时 候 使 用 了 unsafe 关 键 字 ， 而 
有 昌 使 用 了 #[may_dangle] 这 个 attribute。 它 是 跟 drop check 相 关 的 ， 下 一 
广 会 继续 分 析 。 现 在 继续 看 这 个 析 构 函数 的 逻辑 ， 它 调用 了 libcore 里 
面 的 ptr: : drop_in_place 函 数 : 


#[lang = "drop_in_place"] 

#[allow(unconditional_recursion)] 

pub unsafe fn drop_in_place<T: ?Sized>(to_ drop: *mut T) { 
// Code here does not matter - this is replaced by the 
// real drop glue by the compiler. 
drop_in_place(to_drop); 


而 这 个 函数 有 #[lang="drop_in_place"]attribute， 这 说 明 它 是 编译 需 
提供 的 特殊 实现 ， 所 以 它 的 画 数 体 我 们 就 不 再 继续 深究 了 ， 这 里 写 的 
不 是 它 的 真实 逻辑 。 总 之 它 束 是 告诉 编译 右 ， 调 用 这 个 指针 指 回 对 象 
的 析 构 函数 。 需 要 注意 的 是 约束 T: ? Sized， 这 和 意味 着 这 个 泛 型 参数 
可 以 是 定 长 类 型 ， 也 可 以 是 变 长 类 型 ， 即 DST。 当 T 是 变 长 类 型 的 时 
T 实 际 上 是 一 个 “ 胖 指 针 *， 这 种 情况 它 也 是 可 以 处 
理 的 。 


所 以 我 们 看 到 在 Vec 的 析 构 函数 里 面 ， 传 递 进 去 的 实际 参数 是 一 个 
。 编译 器 会 逐个 调用 这 个 slice 里 面 每 个 对 象 的 析 构 函 
数 。 


Vec 的 析 构 函数 调用 完 之 后 ， 编 译 亏 还 会 目 动 调用 它 所 有 成 员 的 析 
构 函 数 。 我 们 再 看 一 下 RawVec 类 型 的 析 构 函数 : 


unsafe impl<#[may_dangle] T, A: Alloc> Drop for RawVec<T, A> { 
/// Frees the memory owned by the RawVec *without* trying to Drop its 
contents. 
fn drop(&mut self) { 
unsafe { self.dealloc buffer(); } 
} 
} 


它 做 的 事情 就 是 回收 内 存 ， 无 须 调用 析 构 函数 。 其 中 
dealloc_buffer 函 数 的 实现 为 : 


impl<T, A: Alloc> RawVec<T, A> { 
/// Frees the memory owned by the RawVec *without* trying to Drop its 
contents. 
pub unsafe fn dealloc buffer(&mut self) { 
let elem size = mem::size_of::<T>(); 
If elem size != © { 

If let Some(layout) = self.current_ layout() { 
let ptr = self.ptr() as *mut u8; 
self.a.dealloc(ptr, layout); 

} 

} 
} 
} 


当 size_of: : <T> () 是 0 的 上 时候， 根本 没有 在 堆 上 分 配 内存 ， 所 
以 无 须 处 理 ， 否 则 ， 调 用 allocator 的 dealloc 画 数 即 可 。 


20.3.2 Drop Check 


下 面 来 详细 说 明 一 下 什么 是 drop check。Vec 的 析 构 函数 中 出 现 的 # 
[may_dangle] 客 竟 是 什么 呢 ? 

请 大 家 注意 ，'a: 这 个 标记 代表 的 含义 是 'a 比 bb 长 或 者 相等 。 什 
么 情况 下 ， 它 们 可 以 相等 呢 ? 当 两 个 变量 声明 在 同一 条 语句 的 时 候 ， 


它们 的 生命 周期 是 相等 的 。 
也 束 是 说 ， 假 如 我 们 按 顺 序 声明 两 个 变量 : 


let a = default()， 
let b = default()， 


那么 a 的 生命 周期 一 定 闫 格 大 于 b 的 生命 周期 。 如 果 我 们 记录 a 的 生 
命 周 期 为 a，b 的 生命 周期 为 b， 那 么 a: 成立 ， 而 b: "a 不成立。 
此 ， 在 a 里 面 引用 b 一 定 是 行 不 通 的 。 


但 是 ， 假 如 我 们 把 它们 在 一 条 语句 中 一 起 声明 : 


let (a, b) = (default(), default()); 


它们 的 生命 周期 是 相等 的 。 如 果 我 们 记录 a 的 生命 周期 为 a ，b 的 
生命 周期 为 b， 那 么 a: b 成 立 ， 而 Pb: "a 也 成 立 。 我 们 可 以 用 示例 来 证 
日 


fn main() { 


let (a, mut b) : (i32, Option<&i32>) = (1, None); 
b = Some(&a) ， 


let (mut a, b) : (Option<&i32>, i32) = (None, 1); 
a = Some(&b); 


上 面 的 代码 可 以 编译 通过 ， 正 古 说 明了 以 上 的 状况 。 


Rust 之 所 以 这 么 规定 ， 征 因为 在 同一 条 语句 中 声明 出 来 的 不 同 变 
量 绑 定 ， 无 法 根据 先后 关系 确定 出 哪个 严格 包含 于 哪个 。tuple 里 面 的 
两 个 成 员 的 生命 周期 不 存在 已 格 大 于 和 小 于 关系 ，struct 里 面 不 同 成 员 
的 生命 周期 也 不 存在 严格 大 于 和 小 于 关系 ， 数 组 里 面 不 同 成 员 的 生命 
周期 同样 不 存在 产 格 大 于 和 小 于 关系 。 它 们 的 生命 周期 都 是 相等 的 。 


这 束 引 出 了 一 个 问题 。 两 个 不 同 的 变量 在 析 构 的 时 候 ， 总 会 出 现 
一 个 先 一 个 后 ， 不 可 能 同时 析 构 。 如 有 果 同 一 条 语句 中 声明 的 不 同 变 量 
可 以 存在 引用 关系 ， 那 么 如 果 我 们 在 析 构 函数 中 ， 试 图 访问 另外 一 个 
变量 ， 会 出 现 什 么 情况 呢 ? 我 们 写 一 个 示例 : 


struct T { dropped: bool } 


impl] T { 
fn new() -> Self { 
T { dropped: false } 
} 


} 


impl Drop for T { 
fn drop(&mut self) 区 
self,.dropped = true; 
} 


} 


struct R<'a> { 
inner: Option<&'a T> 
} 


impl<'a> R<'a> { 
fn new() -> Self { 
R { inner: None } 


} 

fn set_ref<'b :'a>(&mut self, ptr: &'b T) { 
Self,inner = Some(ptr); 

} 


} 


impl<'a> Drop for R<'a> { 
fn drop(&mut self) 区 
if let Some(ref inner) = self.inner { 
println!("droppen R when T is {}", inner.dropped); 
} 


} 
} 


fn main() { 
{ 


let (a, mut b) : (T, R) = (T::new(), R::new()); 
b.set_ref(&a); 


Pn 


let (mut a, b) : (R, T) = (R::nNew(), T::new()); 
a.set_ref(&b); 


这 个 示例 保持 了 上 个 示例 的 代码 结构 ， 只 是 把 基本 类 型 替换 成 了 
市 有 析 构 函数 的 目 定义 类 型 。 编 译 之 后 出 现 了 生命 周期 编译 错误 : 


error[E0597]: ‘a does not live long enough 


这 样 看 来 ， 我 们 原来 想象 的 ， 在 析 构 函数 中 访问 相同 生命 周期 的 
变量 ， 制 造 内 存 不 安全 的 想法 是 行 不 通 的 。 


为 什么 前 面 的 代码 使 用 基本 i32 和 &i32 类 型 可 以 编译 通过 ， 而 我 们 
换 成 自 定 义 类 型 束 通 不 过 了 呢 ? 这 束 是 所 请 的 drop checker。Rust 在 涉 
及 析 构 函数 的 时 候 有 个 特殊 规定 ， 即 如 果 两 个 变量 具有 析 构 函数 ， 且 
有 互相 引用 的 关系 ， 那 么 它们 的 生命 周期 必须 满足 "严格 大 于 ”的 关 
系 。 这 个 关系 目前 在 源码 中 表达 不 出 来 ， 但 是 为 了 防止 析 构 函数 中 出 
现 内 存 安全 问题 ， 编 译 絮 内 部 对 此 专门 做 了 检查 。 


但 是 这 种 检查 又 有 点 过 于 严格 。 因 为 在 很 多 情况 下 ， 虽 然 它 们 有 
引用 关系 ， 但 是 并 没有 在 析 构 函数 中 做 数据 访问 。 此 事 取 决 于 析 构 函 
数 具体 做 了 什么 。 如果 析 构 函 数 没 有 做 什么 危险 的 事情 ， 那 么 它们 之 
间 的 生命 周期 满足 普通 的 大 于 等 于 关系 瓯 够 了 。 所 以 设计 者 决定 ， 暂 
时 留 一 个 后 门 ， 让 用 户 告诉 编译 器 这 个 析 构 函数 究竟 危险 还 是 不 危 
仿 ， 这 了 腕 是 #[may_dangle]attribute 的 由 来 。 在 上 例 中 ， 我 们 如 果 把 R 类 
型 的 析 构 函数 改 为 : 


unsafe impl<#[may_dangle] 'a> Drop for R<'a> { 
fn drop(&mut self) { 
} 

} 


再 打开 相应 的 feature gate: 


#![feature(generic param attrs, dropck_eyepatch)] 


以 上 代码 就 可 以 编译 通过 ， 生 命 周 期 冲突 问题 就 消失 了 。 这 就 是 
为 什么 Vec<T> 的 析 构 函数 用 了 #[may_dangle] 的 原因 。 加 了 这 个 
attribute 可 以 让 Vec 类 型 容纳 生命 周期 不 满足 “严格 大 于 ”关系 的 元 素 。 


关于 此 事 的 详细 解释 ， 请 参考 RFC-1327-dropck-param-eyepatch 。 
这 个 功能 也 只 是 临时 措施 ， 关 于 drop check 的 部 分 ， 后 面 还 会 有 改进 。 


20.4 不 安全 的 边界 


Vec 有 一 个 成 员 方法 叫 作 set lan， 可 以 用 于 改变 动态 数组 的 大 小 。 
它 的 源码 如 下 : 


pub unsafe fn set_len(&mut self, len: usize) { 
self.len = len; 


| 关于 这 个 方法 ， 需 要 请 大 家 注意 的 是 ， 它 有 unsafe 标 记 。 它 的 内 
部 只 是 一 个 usize 类 型 的 赋值 而 已 ， 怎 么 会 是 unsafe 呢 ? 


因为 ， 我 们 的 Vec 内 部 实现 非常 依赖 于 self.len 这 个 值 的 合法 性 。 如 
果 说 这 个 方法 不 是 unsafe， 外 部 的 使 用 者 可 以 随意 设置 动态 数组 的 大 
小 ， 那 么 用 户 可 以 将 其 大 小 突然 变 很 大 ， 然 后 就 可 以 通过 这 个 Vec 访 问 
本 不 该 属于 它 的 内 容 ， 这 殊 造 成 了 “内 存 不 安全 ”的 情况 。 


所 以 ， 我 们 一 定 要 注意 的 是 ， 判 断 一 个 函数 是 否 应 该 是 一 个 
0 不 该 看 它 表 面 的 逻辑 ， 而 应 该 判断 用 户 使 用 它 的 时 候 造 
的 影响 。 


当 我 们 使 用 unsafe 代 码 块 的 时 候 ， 很 可 能 需要 一 些 对 safe 代 码 的 隐 
含 的 假设 和 依赖 ， 这 些 依赖 天 系 既 不 能 通过 类 型 系统 同 编 译 右 清楚 表 
达 ， 也 未 必 能 在 代码 中 明显 地 表现 出 来 。safe 代 码 有 义务 维持 unsafe 代 
码 相 对 应 的 假设 ，unsafe 代 码 中 也 要 注意 保持 一 致 性 。 如 采 这 些 假设 
一 旦 被 破坏 ， 那 这 个 库 的 安全 性 也 吏 功 亏 一 簧 了 。 只 要 你 在 某 个 函数 
内 部 使 用 了 unsafe 代 码 块 ， 你 需要 关注 的 束 不 只 是 这 个 函数 的 正确 
性 ， 还 有 这 个 类 型 中 ， 甚 至 是 这 个 模块 中 ， 其 他 所 有 函数 的 正确 性 ， 
它们 是 互相 影响 互相 搭配 的 。 


对 于 Vec 类 型 ， 我 们 需要 保证 任何 时 候 self.len 这 个 成 员 都 应 该 准确 
地 反映 它 内 部 的 成 员 个 数 。 这 个 要 求 ， 我 们 无 法 利用 类 型 系统 或 者 别 
的 什么 语言 特性 表达 出 来 。 因 为 这 个 成 员 赋 值 ， 可 能 是 安全 的 ， 也 可 
能 是 不 安全 的 ， 取 决 于 上 下 文 逻辑 。 所 以 ， 这 个 方法 必须 用 unsafe 标 
记 。 而 用 户 在 使 用 的 时 候 ， 如 果 已 经 在 逻辑 上 保证 了 这 个 赋值 是 安全 


的 ， 那 么 就 可 以 在 那个 地 方 利 用 unsafe 代 码 块 调用 这 个 方法 ， 否 则 就 
不 该 调用 。 


再 举 个 例子 ， 我 们 使 用 unsafe 代 码 来 访问 数组 内 部 的 数据 : 


fn index(arr: &[u8], idx: usize) -> Option<u8> { 
if idx < arr.len() { 
unsafe 区 
let p = arr.as_ptr().offset(idx as isize); 
Some(*p) 


} else { 
None 
} 
} 


fn main() { 
let arr = [1,2,3,4,5]; 
println!("{:?}", index(&arr, 3)); 


基本 逻辑 很 简 单 ， 通 过 裸 指针 的 算术 运算 ， 指 向 我 们 需要 的 日 
标 ， 然 后 将 数据 读 出 来 。 这 上 段 代码 将 不 安全 的 内 部 实现 和 安全 的 外 部 
API 良 好 地 结合 在 了 一 起 ， 是 符合 Rust 的 设计 思路 的 。 


在 这 个 例子 中 ， 如 果 我 们 把 if 条 件 稍 作 改 动 ， 变 成 : 


If idx <= arr.len() 


那么 这 个 函数 束 变 成 了 “不 安全 ”的 代码 ， 外 部 用 户 有 机 会 通过 安 
全 代码 读 取 不 属于 这 个 数组 的 内 容 ， 而 且 编 译 絮 检查 不 出 来 。 需 要 注 
意 的 是 ， 我 们 这 里 只 修改 了 安全 代码 ， 但 它 制造 了 不 安全 现象 。 这 是 
因为 我 们 内 部 的 unsafe 语 句 块 中 ， 已 经 假定 了 idx 的 数值 是 合法 的 。 我 
们 在 unsafe 块 的 外 部 ， 就 需要 通过 逻辑 来 保证 这 一 点 ， 否 则 就 是 bug 。 


所 以 ， 基 于 unsafe 代 码 写 库 很 难 ， 难 束 难 在 你 不 仅 要 测试 正常 情 
况 下 功能 的 正确 性 ， 还 必须 考虑 用 户 可 能 的 各 种 行为 是 否 有 可 能 在 
safe 代 码 中 利用 你 这 个 库 制 造 内 存 不 安全 。 在 C/C++ 中 ， 如 采用 户 可 以 
通过 一 个 库 制 造 内 存 不 安全 ， 那 是 用 户 的 问题 ， 作 为 库 只 需要 提供 功 
能 束 足 够 了 ， 无 须 保 证 安全 性 ， 当 然 你 也 保证 不 了 ， 顶 多 也 束 “ 防 君子 
不 防 小 人 ”。 跟 C/C++ 相 比 ，Rust 提 供 的 保证 要 严格 得 多 ， 如 采用 户 有 


机 会 利用 你 的 库 在 不 使 用 unsafe 关 键 子 的 情况 下 制造 出 “内 存 不 安全 ”， 
那 这 个 库 萄 有 严重 bug， 古 低 质 量 的 、 不 可 接受 的 。 


20.5 目 定 义 解 引用 


继续 分 析 Vec 的 源码 。Vec 是 一 个 “动态 数组 ”， 它 的 行为 应 该 尽量 
与 默认 的 定 长 数组 一 致 。 语 言 内 置 的 定 长 数组 文 持 数组 切片 功能 ， 可 
以 使 用 一 个 Slice 作 为 指 辐 数组 某 个 部 分 的 “视图 *”。 那 我 们 也 应 该 为 Vec 
实现 这 样 的 功能 。 这 种 情况 我 们 需要 利用 Deref， 代 码 如 下 : 


impl<T> ops::Deref for Vec<T> { 
type Target = [T]; 


fn deref(&self) -> &[T] { 
unsafe 区 
let p = self.buf.ptr(); 
assume(!p.is_null()); 
slice::from raw_parts(p, self.1len) 
} 
} 
} 


Target 类 型 是 [T]， 这 意味 着 *Vec<T> 的 类 型 为 [T]， 所 以 &*Vec<T> 
的 类 型 为 &[T] 。 


当 碰 到 可 以 * 隐 了 式 目 动 deref" 的 场景 时 ，&Vec<T> 类 型 如 采 不 匹 
配 ， 编 译 器 就 会 继续 尝试 &*Vec<T>， 即 &[T] 类 型 来 匹配 。 所 以 ， 我 
们 融 可 以 在 需要 &[T] 类 型 的 时 候 ， 直 接 使 用 &Vec<T> 。 


Deref 在 许多 时 候 都 很 有 用 。 因 为 Deref 的 存在 ， 实 现 vec[..] 这 样 的 
功能 很 商 单 ， 因 为 编译 需 会 帮 我 们 实现 类 型 目 动 转换 : 


impl<T> ops::Index<ops::RangeFull> for Vec<T> { 
type Output = [T]; 


#[inline] 


fn index(&self, _index: ops::RangeFull) -> &[T] { 
self 
} 


} 


我 们 知道 self 的 类 型 是 &Vec<T>， 而 函数 定义 的 返回 类 型 是 &[ 了 T]， 
因为 有 Deref 的 存在 ， 编 译 亏 会 帮 有 我 们 做 这 个 目 动 类 型 转换 。 


再 比如 索引 Index 功 能 ， 其 内 部 实现 方式 吏 是 先 deref 为 原生 数组 类 
型 ， 然 后 利用 内 置 数 组 的 Index 功 能 实现 ; 


impl<T> Index<usize> for Vec<T> { 
type Output = T; 
#[inline] 
fn index(&self, index: usize) -> &T { 
// NB built-in indexing via ‘&[T]. 
&(**self)[index] 
} 
} 


读者 看 到 (**self) 的 时 候 不 要 惊慌 ， 我 们 慢 慢 分 析 。self 类 型 是 
RrVec<T>， 因 此 *self 类 型 是 Vec<T>，**self 类 型 是 [T]。 因 此 这 人 句 话 的 
意思 是 : 对 [T] 执 行 Index 操 作 后 ， 再 把 引用 返回 。 


20.6 ”迭代 器 


我 们 知道 ， 可 以 通过 Vec: : iter () 方法 创建 一 个 动态 数组 的 迭 
代 硕 。 但 是 我 们 在 源码 中 却 没有 见 到 这 个 方法 的 存在 。 这 十 因为 这 个 
7 | 方法 ，Vec 只 是 自动 deref 后 调用 了 原生 数组 的 
适 代 褒 而 已 。 


但 是 ，Vec 类 型 本 身 也 是 可 以 用 于 for 循 环 中 的 : 


fn main() { 
let x = vec![0_ i32, 1, 2]; 
for item in x { println!("{}", item); } 


} 


这 是 因为 Vec 实 现 了 IntolIterator trait。 标 准 库 中 的 IntolIterator 丈 是 编 
译 姨 留 下 来 的 一 个 扩展 内 置 for 循 环 语法 的 接口 。 任 何 自 定义 类 型 ， 只 
要 合理 地 实现 了 这 个 trait， 就 可 以 被 用 在 内 置 的 for 循 环 里 面 。 关 于 迭 
代 器 的 更 多 内 容 ， 在 本 书 第 三 部 分 继续 讲述 。 


关于 迭代 器 ， 有 一 个 Vec: : drain 方 法 实现 得 比较 特殊 ， 这 里 专 
门 拿 出 来 讲 一 下 。 它 的 功能 是 从 动态 数组 中 把 一 个 范围 的 数据 “ 移 
除 ? 出 去 ， 返 回 的 还 是 一 个 “迭代 右 ”。 我 们 还 可 以 遍历 一 次 这 个 迭代 
硕 ， 使 用 已 经 个 移 除 的 那些 元 素 。 示 例如 下 : 


fn main() { 
let mut origin = vec![0, 1, 2, 3, 4, 5]; 


println!("Removed:"); 
for i in origin.drain(1..3) { 
println!("{}", 1); 


println!("Left:"),; 
for i In origin.iter() { 
println!("{}", 1); 


drain () 方法 返回 的 类 型 束 是 一 个 普通 的 迭代 器 ， 在 标准 库 中 ， 
这 个 方法 的 源码 如 下 所 示 : 


pub fn drain<R>(&mut self, range: R) -> Drain<T> 
where R: RangeArgument<usize> 


let len = self.len(); 

let start = match range.start() { 
Included(&n) => n, 
Excluded(&n) => n +1, 
Unbounded => 0, 

}; 

let end = match range.end() { 
Included(&n) => n +1, 
Excluded(&n) => n, 
Unbounded => len, 


/ 
assert!(start <= end); 
assert!(end <= len); 


unsafe 区 
self,set_len(start); 
let range_slice = slice::from raw parts mut(self.as mut_ptr().offset 
(start as isize), end - start); 


Drain { 
tail_ start: end, 
tail_len: len - end, 
iter: range_slice.iter(), 
vec: Shared::from(self), 

} 

} 
} 


返回 的 这 个 Drain 类 型 实现 了 Tterator trait， 具 体 源 码 惑 不 详细 列 出 
了 。 总 之 遍历 Drain 这 个 迭代 器， 会 把 所 有 应 该 被 删除 的 元 素 般 历 一 
通 。 而 Drain 类 型 还 实现 了 一 个 析 构 函数 。 当 它 目 己 被 销毁 的 时 候 ， 它 
和 
| 盾 。 


大 致 原理 束 生 这 样 。 竺 别 需 要 注意 的 是 ， 在 Vec: : drain 方 法 中 
创建 迭代 器 之 前 ， 先 调用 了 self.set_len (start) 方法 。 那 么 这 个 设置 的 
目的 是 什么 呢 ? 

这 个 设计 实际 上 是 为 了 防止 另 一 种 情况 下 的 内 存 不 安全 。 

我 们 假设 用 户 写 了 这 样 的 代码 : 


fn main() { 
let mut origin = vec![ 
"0".to_string(), "1".to_string(), "2".to_string(), 
"3",.to_string(), "4".to_string(), "5".to_string()]; 


let mut d = origin.drain(1..3); 
let s: Option<String> = d.next(); 
println!i("{:?}", SsS); 
let s: option<String> = = d.next(); 
println!("{:?}", 
let s: ee = d.next(); 
println!("{:?}", Ss); 
std: :mem: :forget(d); 

} 


println!("Left: 
for i in origin. ,ber { 
println!("{:?}", i); 


前 面 讲 泄露 的 时 候 已 经 说 过 了 ，std: : mem: : forget 画 2 
带 unsafe 修 饰 的 。 它 可 以 阻止 一 个 类 型 的 析 构 函数 调用 ， 析 构 瑟 净 
不 能 保证 一 定 会 被 调用 的 。 在 这 种 情况 下 ，Drain 类 型 没有 机 会 执行 它 
的 析 构 函数 ， 所 以 它 没有 机 会 修改 原始 的 Vec， 把 数据 从 Vec 中 移 除 。 


假设 没有 self.set len (start) ; 这 个 函数 调用 ， 在 上 面 的 例子 中 会 
出 现 茶 些 字 符 串 元 素 己 经 伏 Drain 运 代 峰 取出 来 消费 挥 了 ， 但 是 Vec 中 
还 存 有 一 份 * 副 本 ”， 而 这 个 副本 本 号 处 于 一 种 “未 初始 化 状态 ”， 它 们 
从 逻辑 上 已 经 被 移 走 了 ， 但 依然 被 认为 是 Vec 的 正常 数据 。 这 是 典型 的 
内 存 不 安全 的 情况 。 


所 以 ， 在 标准 库 中 ，drain () 方法 内 部 在 返回 迭代 器 之 前 ， 先 把 
当前 Vec 的 大 小 设置 为 一 个 比较 小 的 绝对 安全 的 值 。 如 果 说 这 个 drain 
() 方法 返回 的 类 代 器 因为 某 种 原因 未 能 成 功 析 构 ， 那 么 最 坏 的 结 
也 就 是 ， 原 数组 中 仪 镜 下 了 start 之 前 的 元 素 。 至 少 我 们 可 以 肯定 ， 任 
何 情况 下 ， 数 组 中 的 数据 都 是 符合 “内 存 安全 ”的 。 如 来 这 个 迄 代 右 的 
析 构 函数 成 功 执行 了 ， 那 么 and 之 后 的 元 聚会 癌 前 移动 ， 数 组 的 长 度 会 
被 重 置 ， 这 时 候 这 个 逻辑 才 算 执行 完整 。 


析 构 函数 泄 凋 绝对 不 是 我 们 期 望 发生 的 事情 ， 我 们 只 起 无 法 阻止 
这 种 情况 而 已 。 所 以 ， 在 写 库 的 时 候 要 注意 ， 我 们 的 底线 是 即便 析 
构 函 数 泄 调 会 导致 允 辑 错误 ， 也 不 会 发 生 * 内 存 不 安全 ” 


20.7 panic safety 


在 利用 unsafe 写 库 的 时 候 ， 还 需要 注意 的 一 点 是 “panic 安 全 ”。 
panic 在 什么 情况 下 发 生 是 难以 预测 的 ， 我 们 要 做 的 是 ， 即 便 在 发 生 
panic 的 上 时候， 也 能 保证 “内 存 安全 ”。 


我 们 以 Vec: : truncate 方 法 为 例 来 说 明 “panic 安 全 ”是 怎么 做 到 
的 。 这 个 方法 用 于 把 数组 切 掉 一 部 分 ， 只 保留 前 面 的 部 分 ， 后 面 的 部 
分 扔 掉 。 所 以 ， 我 们 可 以 想到 的 实现 逻辑 应 该 是 针对 被 切 掉 的 部 分 ， 
最 后 重新 设置 一 下 数组 的 长 度 大 小 即 
HI o 


可 异 这 么 做 是 不 对 的 。 因 为 "对象 的 析 构 函数 ”是 用 户 目 定义 的 行 
为 ， 在 这 个 方法 里 面 会 执行 什么 逻辑 是 无 法 提前 确定 的 。 所 以 ， 我 们 
应 该 假设 它 有 可 能 发 生 panic。 如 果 有 对 象 已 经 执行 了 析 构 ， 但 是 还 继 
续 把 它 留 在 数组 里 面 ， 等 待 数组 最 后 来 重新 设置 长 度 ， 是 有 风险 的 。 
所 以 标准 库 里 面 的 代码 是 这 么 做 的 : 每 次 执行 析 构 前 先 把 数组 长 度 减 
1， 从 人 逻辑 上 将 元 素 从 数组 中 移 除 ， 然 后 执行 析 构 函数 。 源 码 如 下 所 
ZS: 


pub fn truncate(&mut self, len: usize) { 
unsafe 区 

// drop any extra elements 

while len < self.len 
// decrement len before the drop_in place(), so a panic on Drop 
// doesn't re-drop the just-failed value. 
self.len -= 1; 
let len = self.len; 
ptr::drop_in_place(self.get_unchecked_ mut (len)); 


所 以 ， 大 家 在 读 源码 的 时 候 ， 不 仅 要 看 到 别人 是 这 样 写 的 ， 更 要 
看 到 别人 为 什么 不 会 那样 写 。 这 段 代码 看 起 来 好 像 不 够 优化 ， 在 每 次 
循环 的 时 候 减 1， 却 没有 在 循环 前 或 者 后 面 一 次 性 减 掉 lan。 这 样 做 是 
有 原因 的 。 请 读者 仔细 理解 源码 中 的 那 条 注释 。 同 样 的 道理 ， 类 似 的 
保障 异常 安全 的 设计 ， 我 们 还 可 以 在 extend_with 等 方法 中 看 到 。 这 个 
方法 是 实现 resize、resize_default 等 方法 的 基础 。 


impl<T> Vec<T> { 
/// Extend the vector by ‘'n’ values, using the given generator. 
fn extend_ with<E: Extendwith<T>>(&mut self, n: usize, value: E) { 
self.reserve(n); 
unsafe 区 
let mut ptr = self.as mut_ptr().offset(self.len() as isize),; 
// Use SetLenonDrop to work around bug where compiler 
// may not realize the store through “ptr ”through self.set_len() 
// don't alias， 
let mut local len = SetLenonDrop: :new(&mut self.1en); 


// Write all elements except the last one 
for _ in 1..n { 
ptr::write(ptr, value.next()); 
ptr = ptr.offset(1); 
// Increment the length in every step in case next() panics 
local len.increment_len(1); 


} 
if n>0f 
// We can write the last element directly without cloning 
needlessly 
ptr::write(ptr, value.1last()); 
local len.increment_len(1); 
// len set by scope guard 
} 
} 
} 


这 个 方法 是 往 Vec 后 面 继续 扩展 n 个 元 素 ， 这 n 个 元 素 可 以 是 通过 一 
个 元 素 clone () 而 来 ， 也 可 以 是 调用 Default: : default () 构造 而 
来 O 


大 家 可 以 注意 到 ， 在 真正 写 入 数据 之 前 ， 先 创建 了 一 个 
SetLenOnDrop 类 型 的 变量 local len ， 另 外 每 次 写 入 一 个 新 的 元 素 之 
后 ， 都 会 将 这 个 变量 重新 设置 长 度 。 而 这 个 SetLenOnDrop 类 型 的 主要 
功能 ， 就 是 在 析 构 的 时 候 修改 Vec 的 真正 长 度 。 因 为 在 这 段 unsafe 代 码 
中 ， 需 要 调用 value.next () 方法 ， 而 这 个 方法 最 后 会 调用 到 元 素 的 
T: : default () 或 者 T: : clone () 方法 。 这 些 方法 的 实现 ， 取 决 于 
外 部 元 素 类 型 的 实现 ， 它 们 会 不 会 导致 panic， 写 容器 的 作者 是 不 知道 
的 。 因 此 ，Vec 容 器 的 作者 只 能 假定 这 些 外 部 方法 是 有 panic 风 险 的 。 
为 了 保证 在 发 生 panic 之 后 Vec 内 部 包含 的 依然 是 合法 数据 ， 一 定 要 每 
次 成 功 写 入 一 个 元 素 之 后 ， 马 上 更 新 长 度 信 息 。 


第 三 部 分 “局 级 抽 和 银 


Rust 既 有 面向 人 硬件、 面向 的 层 、 执 行 效率 高 的 特点 ， 也 有 面向 下 
闭 、 面 向 抽象 、 表 达能 力 强 的 特点 。 本 部 分 主要 讲解 Rust 提 供 的 一 系 
列 高 级 抽象 工具 。 


第 21 章 ” 泛 型 


泛 型 《Generics) 是 指 把 类 型 抽象 成 一 种 “参数 "， 数 据 和 算法 都 针 
对 这 种 抽象 的 类 型 参数 来 实现 ， 而 不 针对 具体 类 型 。 当 我 们 需要 真正 
使 用 的 时 候 ， 再 具体 化 、 实 例 化 类 型 参数 。 


21.1 ”数据 结构 中 的 泛 型 
有 时 候 ， 我 们 需要 针对 多 种 类 型 进行 统一 的 抽象 ， 这 就 是 泛 型 。 
泛 型 可 以 将 < 类 型 > 作为 参数 ， 在 画 数 或 者 数据 结构 中 使 用 。 


再 以 我 们 熟悉 的 Option 类 型 举例 。 它 殉 是 一 个 泛 型 enum 类 型 ， 其 
参数 声明 在 尖 括 号 <> 中 。 


enum Option<T> { 
Some(T), 
None, 


} 


这 里 的 <T> 实 际 上 是 声明 了 一 个 “类 型 参数 。 在 这 个 Option 内 部 ， 
Some (T) 是 一 个 tuple struct， 包 含 一 个 元 素 类 型 为 T。 这 个 泛 型 参数 
类 型 T， 可 以 在 使 用 时 指定 具体 类 型 。 


let x: Option<i32> = Some(42) 
let y: Option<f64> = None; 


在 上 述 第 一 行 代码 中 ， 泛 型 参数 T 咎 具体 化 成 了 i32， x 的 类 型 ， 在 
这 里 是 Option<i32>; 在 第 二 行 代 码 中 ， 泛 型 参数 T 被 具体 化 成 了 f64， 
y 的 类 型 ， 在 这 里 是 Option<f64>。 


泛 型 参数 可 以 有 多 个 也 可 以 有 默认 值 。 比 如 : 


struct S<T=i32> { 
data: T 
} 


fn main() { 
let vi = S { data: 0}; 
let v2 = S::<bool> { data: false},; 
println!i("{} {}", vi.data, v2.data); 
} 


对 于 上 例 中 的 泛 型 参数 T， 我 们 可 以 在 使 用 的 时 候 不 指定 类 型 参 
数 。 如 果 不 指定 的 话 ， 参 数 默 认为 32， 也 可 以 在 使 用 的 时 候 指 定 为 其 


他 类 型 。 


使 用 不 同类 型 参数 将 泛 型 类 型 具体 化 后 ， 获 得 的 是 完全 不 同 的 具 
体 类 型 。 如 Option<i32> 和 Option<i64> 是 完全 不 同 的 类 型 ， 不 可 通用 ， 
也 不 可 相互 转换 。 当 编译 器 生成 代码 的 时 候 ， 它 会 为 每 一 个 不 同 的 泛 
型 参数 生成 不 同 的 代码 。 


各 种 目 定 义 复合 类 型 都 可 以 携 市 任意 的 泛 型 参数 。Rust 规 定 ， 所 
有 的 泛 型 参数 必须 是 真 的 被 使 用 过 的 。 下 面 的 代码 吏 会 报错 : 


Struct Num<T> { 
data: i32 
} 


这 个 结构 体 声明 了 一 个 泛 型 参数 ， 但 是 却 并 没有 使 用 它 。 编 译 右 
会 对 这 个 问题 报错 ， 说 有 泛 型 参数 从 来 没有 使 用 过 。 按 下 面 这 样 写 就 
没有 问题 了 : 


Struct Num<T> { 
data: Option<T> 
} 


21.2 ” 凡 数 中 的 之 型 
泛 型 可 以 使 用 在 画 数 中 ， 语 法 类 似 : 


fn compare_option<T>(first: Option<T>, second: Option<T>) -> bool 


match(first, second) { 
(Some(..), Some(..)) => true, 
(None, None) => true, 
_ => false 


在 上 面 这 个 例子 中 ， 画 数 compare_option 有 一 个 泛 型 参数 T， 两 个 
形 参 类 型 均 为 Option<T>。 这 意味 着 这 两 个 参数 必须 是 完全 一 致 的 类 
型 。 如 采 我 们 在 参数 中 传 入 两 个 不 同 的 Option， 会 导致 编译 错误 : 


fn main() { 
println!("{}"，compare_option(Some(1i32)，Some(1.0f32))); // 类 型 不 匹配 编译 错误 


编译 器 在 看 到 这 个 芳 数 调用 的 时 候 ， 会 进行 类 型 检查 ，first 的 形 
参 类 型 是 Option<T>、 实 参 类 型 是 Option<i32>，second 的 形 参 类 型 是 
Option<T>、 实 参 类 型 是 Option<f32>。 这 时 编译 右 的 类 型 推导 功能 会 
进行 一 个 类 似 解 方程 组 的 操作 : 由 Option<T>==Option<i32> 可 得 
T==i32， 而 由 Option<T>==Option<f32> 又 可 得 T==f32。 这 两 个 结论 产 
生 了 矛盾 ， 因 此 该 方程 组 无 解 ， 出 现 编译 错误 。 


如 果 我 们 希望 参数 可 以 接受 两 个 不 同 的 类 型 ， 那 么 需要 使 用 两 个 
泛 型 参数 : 


fn _ compare_option<T1，T2>(first: 0ption<T1>，Ssecond: Option<T2>) -> bool { ... } 


一 般 情 况 下 ， 调 用 泛 型 男 数 可 以 不 指定 泛 型 参数 类 型 ， 编 译 丹 可 
以 通过 类 型 推导 目 动 判断 。 某 些 时 候 ， 如 有 果 确 实 需要 手动 指定 沁 型 参 
数 类 型 ， 则 需要 使 用 function_name: : <type params> (function 
params) 的 语法 : 


compare_option: :<i32, f32>(Some(1), Some(1.0)); 


泛 型 函数 在 很 大 程度 上 实现 了 C++ 的 “函数 重 载 ” 功 能 。 比 如 ，str 
类 型 有 一 个 contains 方 法 ， 使 用 示例 如 下 : 


fn main() { 
let s = "hello"; 
println!("{}", s.contains('a')); 
println!("{}", Ss.contains("abc")); 
println!("{}", s.contains(&['H'] as &[char])); 
println!("{}", s.contains(|c : char| c.len_ utf8() > 2)); 


我 们 可 以 看 到 ， 这 个 contains 方 法 可 以 接受 很 多 种 不 同 的 参数 类 
型 ， 使 用 起 来 很 方便 。 那 么 它 征 怎么 实现 的 呢 ? 主要 技术 束 是 泛 型 。 
它 的 等 名 如 下 : 


fn contains<'a, P: Pattern<'a>>(&'a self, pat: P) -> bool 


可 见 ， 它 的 第 二 个 参数 不 是 某 个 具体 类 型 ， 而 是 一 个 泛 型 类 型 ， 
而 且 这 个 泛 型 参数 满足 Pattern trait 的 约束 。 这 意味 着 ， 所 有 实现 了 
Pattern trait 的 类 型 ， 都 可 以 作为 参数 使 用 。 我 们 和 希望 这 个 参数 接受 哪 
些 类 型 ， 就 针对 这 个 类 型 实现 这 个 trait 即 可 。 


Rust 没 有 C++ 那 种 无 限制 的 ad hoc 式 的 函数 重 载 功能 。 现 在 没有 ， 
将 来 也 不 会 有 。 主 要 原因 是 ， 这 种 随意 的 丽 数 重 载 对 于 代码 的 维护 和 
可 读 性 是 一 种 伤害。 通过 泛 型 来 实现 类 似 的 功能 是 更 好 的 选择 。 如 果 
说 ， 不 同 的 参数 类 型 ， 没 有 办 法 用 trait 统 一 起 来 ， 利 用 一 个 函数 体 来 
统一 实现 功能 ， 那 么 它们 束 没 必要 共用 同一 个 函数 名 。 它 们 的 区 别 已 
经 足够 大 ， 所 以 理应 使 用 不 同 的 名 字 。 强 行使 用 同一 个 函数 名 来 表示 
区 别 非 常 大 的 不 同 画 数 逻 辑 ， 并 不 是 好 的 设计 。 


我 们 还 有 男 外 一 种 方案 ， 可 以 把 不 同 的 类 型 统一 起 来 ， 那 就 是 
enum。 通 过 enum 的 不 同 成 员 来 携 市 不 同 的 类 型 信息 ， 也 可 以 做 到 类 
似 “ 画 数 重 载 ”的 功能 。 但 这 种 做 法 跟 “ 函 数 重 载 * 有 本 质 区 别 ， 因 为 它 
征 有 运行 时 开销 的 。enum 会 在 执行 阶段 判断 当前 成 员 是 哪个 变 体 ， 
而 “ 范 数 重 载 ”以 及 泛 型 函数 都 吓 在 编译 阶段 静态 分 派 的。 同样 ，Rust 


也 不 鼓励 大 家 仅仅 为 了 省 去 命名 的 厅 烦 ， 而 强行 把 不 同类 型 用 enum 统 
一 起 来 用 一 个 函数 来 实现 。 如 条 一 定 要 这 么 做 ， 那 么 最 好 是 有 一 个 好 
的 理由 ， 而 不 仅 古 因为 懒得 给 函数 命名 而 已 。 


21.3 impl 块 中 的 泛 型 


impl 的 时 候 也 可 以 使 用 泛 型 。 在 impl<Trait>for<Type>{} 这 个 语法 
结构 中 ， 沁 型 类 型 既 可 以 出 现在 <Trait> 位 置 ， 也 可 以 出 现在 <Type> 位 
置 o 


与 其 他 地 方 的 泛 型 一 样 ，impl 块 中 的 泛 型 也 是 先 声 明 再 使 用 。 在 
impl 抉 中 出 现 的 泛 型 参数 ， 需 要 在 impl 关 键 字 后 面 用 人 尖 括 号 声明 。 


当 我 们 希望 为 某 一 组 类 型 统一 impl 某 个 trait 的 时 候 ， 泛 型 就 非常 有 


用 了 。 有 了 这 个 功能 ， 很 多 时 候 就 没 必要 单独 为 每 个 类 型 去 重复 impl 
了 。 以 标准 库 中 的 代码 为 例 : 


impl<T, U> Into<U> for T 
where U: From<T> 


fn into(self) -> UT 
U::from(self) 


上 面 这 段 代码 中 ，impl 关 键 子 后 面 的 尖 括 号 <T，U> 意 思 是 和 完 声 明 
两 个 沁 型 参数 ， 后 面 会 使 用 它们 。 这 跟 类 型 、 函 数 中 的 沁 型 参数 规则 
一 样 ， 先 声明 、 后 使 用 。 


标准 库 中 的 Into 和 From 是 一 对 功能 互 逆 的 trait。 如 果 A: Into<B>， 
意味 着 B: From<A>。 因 此 ， 标 准 库 中 写 了 这 样 一 段 代 码 ， 意 思 是 针 
对 所 有 类 型 T， 只 要 满足 U: From<T>， 那 么 就 针对 此 类 型 impl 
Into<U>。 有 了 这 样 一 个 impl 块 之 后 ， 我 们 如 果 想 为 目 己 的 两 个 类 型 提 
供 互 相 转换 的 功能 ， 那 么 只 需 impl From 这 一 个 trait 就 可 以 了 ， 因 为 反 
过 来 的 Into trait 标 准 库 已 经 帮忙 实现 好 了 。 


21.4 汉 型 参数 约束 


Rust 的 泛 型 和 C++ 的 template 非 常 相 似 ， 但 也 有 很 大 不 同 。 它 们 的 
最 大 区 别 在 于 执行 类 型 检查 的 时 机 。 在 C++ 里 面 ， 模 板 的 类 型 检查 是 
延迟 到 实例 化 的 时 候 做 的 。 而 在 Rust 里 面 ， 沁 型 的 类 型 检查 是 当场 完 
成 的 。 示 例如 下 : 


// C++ template 示例 

template <class T> 

const T& max (const T& a, const T& b) { 
return (a<b)?b:a; 


} 


void instantiateInt() { 

int m = max(1, 2); // 实例 化 1 
} 
Struct T { 

int value,; 


}; 


void instantiateT() { 
T ti { value: 1}; 
T t2 { value: 2}; 
//T m = max(t1，t2); // 实例 化 2 


int main() { 
instantiateInt(); 


instantiateT( ); 
return ©; 


在 这 个 例子 中 : 如 果 我 们 把 “实例 化 2 处 的 代码 先 注释 掉 ， 使 用 
g++-std=c++11 test.cpp 命 令 编 译 ， 可 以 通过 ; 如 果 取 消 注 释 ， 则 编译 
不 通过 。 编 译 错误 为 : 


error: no match for 'operator<' (operand types are 'const T' and 'const T') 


出 现 编译 错误 的 原因 是 我 们 没有 给 TI 类 型 提供 比较 运算 符 重 载 。 
此 处 的 关键 在 于 ， 如 果 我 们 用 int 类 型 来 实例 化 max 函 数 ， 它 整 可 以 通 
过 ;如 采 我 们 用 目 定 义 的 T 类 型 来 实例 化 max 函 数 ， 它 束 通 不 过 。max 


函数 本 吴 一 直 都 是 没有 问题 的 。 也 吏 是 说 ， 编 译 亏 在 处 理 max 画 数 的 
时 候 ， 根 本 不 去 管 a<b 是 不 是 一 个 合理 的 运算 ， 而 是 将 这 个 检查 留 给 后 
面 实例 化 的 时 候 再 分 析 。 


Rnust 采 取 了 不 同 的 介 略 ， 它 会 在 分 析 泛 型 畏 数 的 时 候 当 场 检 查 类 
型 的 合法 性 。 这 个 检查 是 怎样 做 的 呢 ? 它 要 求 用 户 提供 合理 的 “ 泛 型 约 
束 ”。 在 Rust 中 ，trait 可 以 用 于 作为 “ 泛 型 约束 *。 在 这 一 点 上 ，Rust 跟 
C# 的 设计 是 类 似 的 。 上 例 用 Rust 来 写 ， 大 致 是 这 样 的 逻辑 : 


fn max<T>(a: T, b: T) -> TH 
if a<bIft 
b 
} else { 
a 


} 
} 


fn main() { 
let m = max(1, 2); 
} 


编译 ， 出 现 编译 错误 : 


error[E0369]: binary operation ‘< cannot be applied to type °T. 
--> test.rs:2:8 


2 | 
| 人 八 八 人 八 
| 


note: an implementation of ` std::cmp::Partialord ”might be missing for ‘TT. 


这 个 编译 错误 说 得 很 清楚 了 ， 由 于 泛 型 参数 T 没 有 任何 约束 ， 
此 编译 合 认 为 a<b 这 个 表达 式 是 不 合理 的 ， 因 为 它 只 能 作用 于 支持 比较 
运算 符 的 类 型 。 在 Rust 中 ， 只 有 impl 了 PartialOrd 的 类 型 ， 才能 支持 比 
较 运 算 符 。 修 复方 案 为 泛 型 类 型 T 添 加 泛 型 约束 。 
泛 型 参数 约束 有 两 种 语法 : 
(1) 在 泛 型 参数 声明 的 时 候 使 用 冒号 : 指定 ; 


(2) 使 用 where 子 名 指定 。 


use std::cmp::Partialord; 


// 第 一 种 写法 ; 在 泛 型 参数 后 面 用 冒号 约束 
fn max<T: Partialord>(a: T, b: T) ->T{ 


// 第 二 种 写法 , 在 后 面 单 独 用 where 子 句 指定 
fn max<T>(a: T, b: T) ->T 
where T: Partialord 


在 上 面 的 示例 中 ， 这 两 种 写法 达到 的 目的 是 一 样 的 。 但 是 ， 在 某 
些 情 况 下 (比如 存在 下 文 要 讲解 的 关联 类 型 的 时 候 ) ，where 子 句 比 参 
数 声 明 中 的 冒号 约束 具有 更 强 的 表达 能 力 ， 但 它 在 泛 型 参数 列表 中 是 
无 法 表达 的 。 我 们 以 Iterator trait 中 的 函数 为 例 : 


trait Iterator { 
type Item; // Item 是 一 个 关联 类 型 


// 此 处 的 where 子 句 没 办 法 在 声明 泛 型 参数 的 时 候 写 出 和 
fn max(self) -> Option<Self::Item> 

where Self: Sized, Self::Item: Ord 
{ 


pa 
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它 和 要求 Self 类 型 满足 Sized 约 束 ， 同 时 关联 类 型 Self: : Item 要 满足 
Ord 约 束 ， 这 是 用 冒号 语法 写 不 出 来 的 。 在 声明 的 时 候 使 用 冒号 约束 
的 地 方 ， 一 定 都 能 换 作 where 子 句 来 写 ， 但 是 反 过 来 不 成 立 。 男 外 ， 对 
于 比较 复杂 的 约束 条 件 ，where 子 句 的 可 读 性 明显 更 好 。 


在 有 了 “ 池 型 约束 ”之 后 ， 编 译 需 不 仅 会 在 声明 泛 型 的 地 方 做 类 型 
检查 ， 还 会 在 实例 化 泛 型 的 地 方 做 类 型 检查 。 接 上 例 ， 如 采 回 我们 上 
面 实现 的 那个 max 函 数 传递 目 定义 类 型 参数 : 


Struct T { 
value: i32 


} 


fn main() { 
let ti1 = T { value: 1}; 
let t2= T { value: 2},; 
let m = max(t1i, t2); 

} 


编译 ， 可 见 编译 错误 : 


error[E0277]: the trait bound `T: std::cmp::Partialord ”is not satisfied 
--> test.rs:20:13 


20 let m = max(t1i, t2); 


AAA can't compare  T with TT. 


help: the trait ‘std::cmp::PartialOrd ”is not implemented for °T. 
note: required by ‘max. 


| 
| 
| 

这 说 明 ， 我 们 在 调用 max 函 数 的 时 候 也 要 让 参数 符合 “ 汉 型 约 
束 ”。 因 此 我 们 需要 impl PartialOrd for T。 完 整 代码 如 下 : 


use std::cmp::Partialord; 
Use std::cmp::Ordering; 


fn max<T>(a: T, b: T) ->T 
where T: Partialord 


{ 
ifa<btf 
b 
} else { 
a 
} 
} 
Struct T { 
value: i32 
} 


impl Partialord for T { 
fn partial cmp(&self, other: &T) -> Option<Ordering> { 
self.value.partial cmp(&other.value) 
} 
} 


impl PartialEq for T { 
fn eq(&self, other: &T) -> bool { 
self.value == other.value 
} 


} 


fn main() { 
let ti1 = T { value: 1}; 
let t2= T { value: 2}; 
let m = max(t1i, t2); 


由 0 中 的 PartialOrd 继 承 了 PartialEq， 此 单独 实现 
PartialOrd 还 是 会 产生 编译 错误 ， 必 须 同时 实现 PartialEq 才 能 编译 通 


21.5 “关联 类 型 


trait 中 不 仅 可 以 包含 方法 (包括 静态 方法 ) 、 和 量 ， 还 可 以 包 
含 “ 类 型 ”"。 比 如 ， 我 们 和 常见 的 迭代 器 Iterator 这 个 trait， 它 里 面 束 有 一 个 
类 型 叫 Item。 其 源码 如 下 : 


pub trait Iterator { 
type Item; 


} 


这 样 在 trait 中 声明 的 类 型 叫 作 “关联 类 型 ” (associated type) 。 关 
联 类 型 也 同样 是 这 个 trait 的 “ 汉 型 参数 ”。 只 有 指定 了 所 有 的 泛 型 参数 和 
天 联 类 型 ， 这 个 trait 才 能 真正 地 具体 化 。 示 例如 下 〈 在 泛 型 函数 中 ， 
使 用 Iterator 泛 型 作为 泛 型 约束 ) : 


use std::iter::Iterator,; 
use std::fmt::Debug; 


fn use_iter<ITEM, ITER>(mut iter: ITER) 
where ITER: Iterator<Item=ITEM>, 
ITEM: Debug 


while let Some(i) = iter.next() { 
println!i("{:?}", 1); 


} 


fn main() { 
Jet v: Vec<i32> = vec![1,2,3,4,5]; 
use_iter(v.iter()); 


} 


可 以 看 到 ， 我 们 希望 参数 是 一 个 泛 型 迭代 器 ， 可 以 在 约束 条 件 中 
写 Iterator<Item=ITEM>“。 跟 普通 泛 型 参数 比 起 来 ， 关 联 类 型 参数 必须 
使 用 名 字 赋 值 的 方式 。 那 么 ， 关 联 类 型 跟 普 通 泛 型 参数 有 哪些 不 同 点 
呢 ? 我 们 为 什么 需要 关联 参数 呢 ? 


1. 可 该 性 可 扩展 性 


从 上 面 这 个 例子 中 我 们 可 以 看 到 ， 虽 然 我 们 的 函数 只 接受 一 个 参 
数 iter， 但 是 它 却 需要 两 个 泛 型 参数 : 一 个 用 于 表示 迭代 絮 本 号 的 类 
型 ， 一 个 用 于 表示 和 迭代 锻 中 包含 的 元 素 类 型 。 这 古 相 对 隐 余 的 写法 。 
实际 上 ， 在 有 关联 类 型 的 情况 下 ， 我 们 可 以 将 上 面 的 代码 简化， 示例 


如 下 : 


use std::iter::Iterator; 
use std::fmt::Debug; 
fn use_iter<ITER>(mut iter: ITER) 
where ITER: Iterator, 
ITER: :Item: Debug 


while let Some(i) = iter.next() { 
println!("{:?}", 1); 


} 

fn main() { 
let v: Vec<i32> = vec![1,2,3,4,5]; 
use_iter(v.iter()); 


} 


类 同人 


这 个 版 本 的 写法 相对 于 上 一 个 版 本 来 说 ， 沁 型 参数 明显 简 化 了 ， 


我 们 只 需要 一 个 泛 型 参数 即 可 。 在 泛 型 约束 条 件 中 ， 可 以 写 上 ITER 符 


合 Iterator 约 束 。 此 上 时， 我 们 束 已 经 知道 ITER 存 在 一 个 关联 类 型 Ttem， 


可 以 针对 这 个 ITER: : Item 再 加 一 个 约束 即 可 8 如 采 我 们 的 Iterator 中 
的 Item 类 型 不 是 关联 类 型 ， 而 是 普通 泛 型 参数 ， 了 台 没 办 法 进行 这 样 的 


简化 了 。 


我 们 再 看 男 一 个 例子 。 假 如 我 们 想 设计 一 个 泛 型 的 “图 ”类 型 ， 它 
包 全 “顶点 ?和 "“ 边 ?两 个 泛 型 参数 ， 如 采 我 们 把 它们 作为 普通 的 泛 型 参 


数 设 计 ， 那 么 看 起 来 忠 古 : 


trait Graph<N, E> { 
fn has_edge(&self, &N, &N) -> bool; 


} 


现在 如 果 有 一 个 泛 型 画 数 ， 要 计算 一 个 图 中 两 个 顶点 的 距离 ， 
的 签名 会 是 : 


fn distance<N, E, G: Graph<N, E>>(graph: &6, start: &N, end: &N) -> uint { 


mz 


马 


我 们 可 以 看 到 ， 泛 型 参数 比较 多 ， 也 比较 麻烦 。 对 于 指定 的 Graph 
类 型 ， 它 的 顶点 和 边 的 类 型 应 该 是 固定 的 。 在 画 数 签名 中 再 写 一 遍 其 
实 没什么 道理 。 如 果 我 们 把 普通 的 泛 型 参数 改 为 “关联 类 型 "设计 ， 那 
么 数据 结构 就 成 了 ， 


trait Graph { 
type N; 
type E; 
fn has_edge(&self, &N, &N) -> bool; 


} 
对 应 的 ， 计 算 距 离 的 范 数 签名 可 以 简化 成 : 


fn distance<G>(graph: &6, start: &G::N, end: &G::N) -> uint 
where G: Graph 
{ 


} 


由 此 可 见 ， 在 某 些 情况 下 ， 关 联 类 型 比 普通 泛 型 参数 更 具 可 读 


2.trait 的 impl 匹 配 规则 


泛 型 的 类 型 参数 ， 既 可 以 写 在 尖 括 号 里 面 的 参数 列表 中 ， 也 可 以 
写 在 trait 内 部 的 关联 类 型 中 。 这 两 种 写法 有 什么 区 别 呢 ? 我 们 用 一 个 
示例 来 演示 一 下 。 


假如 我 们 要 设计 一 个 trait， 名 字 叫 作 ConvertTo， 用 于 类 型 转换 。 
那么 ， 我 们 就 有 两 种 选择 。 一 种 是 使 用 泛 型 类 型 参数 : 


trait ConvertTo<T> { 
fn convert(&self) -> T,; 


} 


另 一 种 是 使 用 关联 类 型 : 


trait ConvertTo { 
type DEST; 
fn convert(&self) -> Self::DEST， 


} 


如 果 我 们 想 写 一 个 从 i32 类 型 到 f32 类 型 的 转换 ， 在 这 两 种 设计 
下 ， 代 码 分 别 是 : 


impl ConvertTo<f32> for i32 { 
fn convert(&self) -> f32 { *self as f32 } 
} 


以 及 : 


impl] ConvertTo for i32 { 

type DEST = f32; 

fn convert(&self) -> f32 { *self as f32 } 
} 


到 目前 为 止 ， 这 两 种 设计 似乎 没什么 区 别 。 但 是 ， 假 如 我 们 想 继 
续 增加 一 种 从 i32 类 型 到 f64 类 型 的 转换 ， 使 用 泛 型 参数 来 实现 的 话 ， 
可 以 编译 通过 : 


impl ConvertTo<f64> for i32 { 
fn convert(&self) -> f64 { *self as f64 } 
} 


如 有 果 用 关联 类 型 来 实现 的 话 ， 束 不 能 通过 编译 了 : 


impl] ConvertTo for i32 { 

type DEST = f64; 

fn convert(&self) -> f64 { *self as f64 } 
} 


普 误 信息 为 : 


error: conflicting implementations of trait ‘ConvertTo for type ‘i32. 


由 此 可 见 ， 如 采 我 们 采用 了 “关联 类 型 "的 设计 方案 ， 吏 不 能 针对 
这 个 类 型 实现 多 个 impl。 在 编译 志 的 眼 里 ， 如 采 trait 有 类 型 参数 ， 那 么 
给 定 不 同 的 类 型 参数 ， 它 们 融 已 经 是 不 同 的 trait， 可 以 同时 针对 同一 
个 类 型 实现 impl。 如 果 trait 没 有 类 型 参数 ， 只 有 关联 类 型 ， 给 关联 类 型 
指定 不 同 的 类 型 参数 是 不 能 用 它们 针对 同一 个 类 型 实现 impl 的 。 


ConvertTo<f 32> ConvertTo<f64> 


impl 1mpl 


ConvertTo{type 
DEST = £32} 


impl 


ConvertTo{type 
DEST = £64} 


impl 


21.6 ” 何 时 使 用 天 联 类 型 


从 前 文中 大 家 可 以 看 到 ， 虽 然 天 联 类 型 也 是 类 型 参数 的 一 种 ， 但 
它 与 泛 型 类 型 参数 列表 是 不 同 的 。 我 们 可 以 把 这 两 种 泛 型 类 型 参数 分 
为 两 个 类 别 : 

-输入 类 型 参数 

-输出 类 型 参数 

在 尖 括 号 中 存在 的 泛 型 参数 ， 是 输入 类 型 参数 ;在 trait 内 部 存在 
的 关联 类 型 ， 是 输出 类 型 参数 。 输 入 类 型 参数 征用 于 决定 匹配 哪个 
imp]l 版 本 的 参数 ;输出 类 型 参数 则 是 可 以 由 输入 类 型 参数 和 Self 类 型 决 
定 的 类 型 参数 。 


继续 以 上 面 的 例子 为 例 ， 用 泛 型 参数 实现 的 版 本 如 下 : 


trait ConvertTo<T> { 
fn convert(&self) -> T,; 


} 


impl ConvertTo<f32> for i32 { 
fn convert(&self) -> f32 { *self as f32 } 
} 


impl ConvertTo<f64> for i32 { 
fn convert(&self) -> f64 { *self as f64 } 


fn main() { 


let i = 1 i32; 
let f = i.convert(); 
println!i("{:?}", f); 


} 
编译 的 时 候 ， 编 译 恬 会 报错 : 


error: unable to infer enough type information about `_`; type annotations or 
generic parameter binding required 


因为 编译 器 不 知道 选择 使 用 哪 种 convert 方 法 ， 需 要 我 们 为 它 指定 
一 个 类 型 参数 ， 比 如 : 


let f : f32 = i.convert(); 
// 或 者 
let f = ConvertTo::<f32>::convert(&i); 


这 很 像 C++/Java 等 语言 中 存在 的 “函数 重 载 ? 规 则 。 我 们 可 以 用 不 
同 的 参数 类 型 实现 重 载 ， 但 是 不 能 用 不 同 的 返回 类 型 来 做 重 载 ， 因 为 
编译 需 是 根据 参数 类 型 来 判断 调用 哪个 版 本 的 重 载 男 数 的 ， 而 不 是 依 
靠 返回 值 的 类 型 。 


在 标准 库 中 ， 何 时 使 用 泛 型 参数 列表 、 何 时 使 用 关联 类 型 ， 实 际 
上 有 非常 好 的 示范 。 


以 标准 库 中 的 AsRef 为 例 。 我 们 希望 String 类 型 能 实现 这 个 trait， 
而 且 既 能 实现 String: : as_ref: : <str> () 也 能 实现 String: : 
as_ref: : <[u8]> () 。 因 此 AsRef 必 须 有 一 个 类 型 参数 ， 而 不 是 关联 
类 型 。 这 样 impl AsRef<str>for String 和 impl AsRef<[u8]>for String 才 能 
同时 存在 ， 互 不 冲突 。 如 果 我 们 把 目标 类 型 设计 为 天 联 类 型 ， 那 么 针 
对 任何 一 个 类 型 ， 最 多 只 能 impl 一 次 ， 这 就 失去 AsRef 的 意义 了 。 


我 们 再 看 标准 库 中 的 Deref trait。 我们 希望 一 个 类 型 实现 Deref 的 时 
候 ， 最 多 只 能 impl 一 次 ， 解 引用 的 目标 类 型 是 唯一 固定 的 ， 不 要 让 用 
户 在 调用 obj.deref () 方法 的 时 候 指定 返回 类 型 。 因 此 Deref 的 目标 类 
型 应 该 设计 为 “关联 类 型 ”。 否 则 ， 我 们 可 以 为 一 个 类 型 实现 多 次 
Deref， 比 如 impl Deref<str>for String 和 impl Deref<char>for String， 那 
么 针对 String 类 型 做 解 引 用 操作 ， 在 不 同 场景 下 可 以 有 不 同 的 结果 ， 这 
显然 不 是 我 们 希望 看 到 的 。 解 引用 的 目标 类 型 应 该 由 Self 类 型 唯一 确 
定 ， 不 应 该 在 被 调 用 的 时 候 被 其 他 类 型 干扰 。 这 种 时 候 应 使 用 关联 类 
型 ， 而 不 是 类 型 参数 。 关 联 类 型 是 在 imp] 阶 段 确定 下 来 的 ， 而 不 是 在 
函数 调用 阶段 。 这 样 才 是 最 符合 我 们 需求 的 写法 。 


还 有 一 些 情况 下 ， 我 们 既 需 要 类 型 参数 ， 也 需要 关联 类 型 。 比 如 
标准 库 中 的 各 种 运算 符 相 关 的 trait。 以 加 法 运算 符 为 例 ， 它 对 应 的 trait 
为 std: : ops: : Add, 定义 为 : 


trait Add<RHS=Self> { 

type Output; 

fn add(self, rhs: RHS) -> Self::Output,; 
} 


在 这 个 trait 中 ,“ 加 数 ” 类 型 为 Selff,，“ 被 加 数 ” 类 型 被 设计 为 类 型 参 
数 RHS， 它 有 默认 值 为 Self， 求 和 计算 结果 的 类 型 被 设计 为 关联 类 型 
Output。 用 前 面 所 讲解 的 思路 来 分 析 可 以 发 现 ， 这 样 的 设计 是 最 合理 
的 方式 。“ 被 加 数 ” 类 型 在 泛 型 参数 列表 中 ， 因 此 我 们 可 以 为 不 同 的 类 
型 实现 Add 加 法 操作 ， 类 型 A 可 以 与 类 型 B 相 加 ， 也 可 以 与 类 型 C 相 
加 。 而 计算 结果 的 类 型 不 能 是 泛 型 参数 ， 因 为 它 是 被 Self 和 RHS 所 唯 
一 固定 的 。 写 需要 在 impl 阶 段 束 确定 下 来 ， 而 不 是 等 到 函数 调用 阶段 
由 用 户 指定 ， 是 典型 的 “输出 类 型 参数 ”。 


21.7 ， 泛 型 特 化 


Rust 语 言 文 持 认 型 特 化 ， 但 还 处 于 开发 过 程 中 ， 目 前 只 能 在 最 新 
的 nightly 版 本 中 试用 一 些 基 本 功能 。 


Rust 不 文 持 钞 数 和 结构 体 的 特 化 。 它 文 持 的 是 针对 impl 块 的 特 
化 。 我 们 可 以 为 一 组 类 型 impl 一 个 trait， 同 时 为 其 中 一 部 分 更 特殊 的 类 


型 impl 同 一 个 trait 。 


示例 如 下 : 


#![feature(specialization)] 
use std::fmt::Display; 


trait Example { 
fn call(&self); 
} 


impl<T> Example for T 


default fn call(&self) { 
println!("most generic"); 


} 


impl<T> Example for T 
where T: Display 


default fn call(&self) { 
println!("generic for Display, {}", self); 


} 


impl] Example for str { 
fn call(&self) { 
println!("specialized for str, {}", self); 
} 


} 


fn main() { 
let vi = vec![1i32,2,3]; 
let v2 = 1 i32,; 
let v3 = "hello",; 


vi.call(); 
v2.call(); 
v3.call(); 


用 mightly 版 本 编译 ， 执 行 ， 结 果 为 ， 


most generic 
generic for Display, 1 
specialized for str, hello 


这 上 段 代 码 中 有 三 个 impl 块 。 第 一 个 是 针对 所 有 类 型 实现 Example。 
第 二 个 是 针对 所 有 的 满足 TI: Display 的 类 型 实现 Example。 第 三 个 是 针 
对 具体 的 str 类 型 实现 Example。 一 个 比 一 个 更 具体 ， 更 特 化 。 


对 于 主 程序 中 v1.call \) ; 调用 ， 因 为 Vec<i32> 类 型 只 能 匹配 第 

一 个 impl 块 ， 因 此 它 调用 的 是 最 基本 的 版 本 。 对 于 主 程序 中 的 v2.call 
() ; 调用 ， 因 为 132 类 型 满足 Display 约 束 ， 所 以 它 同时 满足 第 一 个 或 

者 第 二 个 impl 块 的 实现 版 本 ， 而 第 二 个 impl 块 比 第 一 个 更 具体 、 更 匹 
配 ， 所 以 编译 器 选择 了 调用 第 二 个 impl 块 的 版 本 。 而 对 于 v3.call () ; 
这 名 代码 ， 实 际 上 三 个 impl 块 都 能 和 str 类 型 相 匹配 ， 但 是 第 三 个 impl 
块 明 显 比 其 他 两 个 imp] 抉 更 特 化 ， 因 此 在 主 程序 中 调用 的 时 候 ， 选 择 
了 执行 第 三 个 imp] 块 提供 的 版 本 。 


在 这 个 示例 中 ， 前 面 的 impl 块 针对 的 类 型 范围 更 广 ， 后 面 的 impl 
块 针 对 的 类 型 更 具体 ， 它 们 针对 的 类 型 集合 是 包含 关系， 这 距 古 特 
化 。 当 编译 侣 发 现 ， 针 对 某 个 类 型 ， 有 多 个 impl 能 满足 条 件 的 时 候 ， 
它 会 目 动 选择 使 用 最 特殊 、 最 匹配 的 那个 版 本 。 


21.7.1 ” 特 化 的 意义 


在 RFC 1210 中 ， 作 者 列 出 了 泛 型 特 化 的 三 个 意义 : 


1. 性 能 优化 。 泛 型 特 化 可 以 为 某 些 情况 提供 统一 抽象 下 的 特殊 实 
更 。 


2. 代 码 重用 。 泛 型 特 化 可 以 提供 一 些 默认 (但 不 完整 的 ) 实现 ， 
某 些 情况 下 可 以 减少 重复 代码 。 


3. 为 “高 效 继承 ”铺路 。 泛 型 特 化 其 实 跟 OOP 中 的 继承 很 像 。 
下 面 拿 标准 库 中 的 代码 举例 说 明 。 


标准 库 中 存在 一 个 ToString trait， 定 义 如 下 : 


pub trait ToString { 
fn to_string(&self) -> String; 


} 


凡是 实现 了 这 个 trait 的 类 型 ， 都 可 以 调用 to_string 来 得 到 一 个 
String 类 型 的 结 思 同时 ， 标准 库 中 还 存在 一 个 std: : fmt: : Display 
trait， 世 可 以 做 到 类 似 的 事情 。 而 且 Display 是 可 以 通过 #[derive 

(Display) ] 由 编译 器 自动 实现 的 。 所 以 ， 我 们 可 以 想到 ， 针 对 所 有 满 
足 T: Display 的 类 型 ， 我 们 可 以 为 它们 提供 一 个 统一 的 实现 : 


impl<T: fmt::Display + ?Sized> ToString for T { 
#[inline] 
fn to_string(&self) -> String { 
Use core::fmt: :Write,; 
let mut buf = String::new(); 


let _ = buf.write fmt(format_args!("{}", self)); 
buf.shrink_to_fit(); 
buf 


} 
} 


这 样 一 来 ， 我 们 惑 没 必 要 针对 每 一 个 具体 类 型 来 实现 ToString。 这 
么 做 ， 非 党 有 利于 代码 重用 ， 所 有 满足 T: Display 的 类 型 ， 都 目 动 拥 
有 了 to_string 方 法 ， 不 必 一 个 个 地 手动 实现 。 这 样 做 代码 确实 简洁 
了 ， 但 是 ， 对 于 某 些 类 型 ， 比 如 &str 类 型 想 调用 to_string 方 法 ， 效 率 就 
有 点 差强人意 了 。 因 为 这 段 代码 针对 的 是 所 有 满足 Display 约 束 的 类 型 
来 实现 的 ， 下 调 用 的 是 fmt 模 块 的 功能 ， 内 部 实现 非常 复杂 而 烦 瑛 。 如 
林 我 们 用 &str 类 型 调用 to_string 方 法 的 话 ， 还 走 这 么 复杂 的 一 套 逻 辑 ， 
略 显 多 余 。 这 也 是 为 什么 在 早期 的 Rust 代 码 中 ，&xstr 转 为 String 类 型 比 
较 推 荐 以 下 方式 : 


// 推荐 

let x : String = "hello".into(); 

// 推荐 

let x : String = String::from("hello"),; 
// 不 推荐 , 因为 效率 低 

let x : String = "hello" ,to_string() 


现在 有 了 泛 型 特 化 ， 这 个 性 能 问题 融 可 以 得 到 修复 了 ， 方 案 如 
下 : 


impl<T: fmt::Display + ?Sized> ToString for T { 
#[inline 
default fn to_string(&self) -> String { 


} 
} 


impl ToString for str { 
#[inline 
fn to_string(&self) -> String { 
String::from(self) 


我 们 可 以 为 那个 更 通用 的 版 本 加 一 个 default 标 记 ， 然 后 再 为 str 类 
型 专门 写 一 个 特殊 的 实现 。 这 样 ， 对 外 接口 依然 保持 统一 ， 但 内 部 实 
现 有 所 区 别 ， 尽 可 能 地 提高 了 效率 ， 满 足 了 “ 零 开 销 抽 象 * 的 原则 。 


21.7.2” default 上下文 关键 字 


我 们 可 以 看 到 ， 在 使 用 泛 型 特 化 功能 的 时 候 ， 我 们 在 许多 方法 前 
面 加 上 了 default 天 键 字 做 修 饥 。 这 个 default 不 是 全 局 关键 字 ， 而 是 一 
个 "上下文 相关 ”关键 字 ， 它 只 在 这 种 场景 下 是 特殊 的 ， 在 其 他 场景 
下 ， 我 们 依然 可 以 用 它 作 为 合法 的 变量 /函数 名 字 。 比 如 标准 库 的 
Default trait 中 ， 就 有 一 个 方法 名 字 叫 作 default () ， 这 并 不 冲突 。 


为 什么 需要 这 样 的 一 个 关键 字 呢 ? 这 是 因为 ， 泛 型 特 化 其 实 很 像 
传统 OOP 中 的 继承 重 写 override 功 能 。 在 传统 的 支持 重 写 功能 的 语言 
中 ， 一般 都 有 一 个 类 似 的 标记 : 


(1) C++ 中 使 用 了 virtual 关 键 字 来 让 一 个 方法 可 以 在 子 类 型 中 重 
写 。Modern C++ 还 文 持 final 和 override 限 定 符 。 


(2) C# 要 求 使 用 virtual 关 键 字 定义 虚 函 数 ， 用 override 关 键 字 标 
记 重 写 方 法 。 


(3) Java 默认 让 所 有 方法 都 是 虚 方 法 ， 但 它 也 支持 用 final 关 键 字 
让 方法 不 可 被 重 写 。 


之 所 以 虚 函 数 需要 这 样 的 标记 ， 主 要 征 因为 重 写 方 法 在 某 种 意义 
上 十 一 种 非 局 部 交互 。 调 用 虚 函 数 的 时 候 ， 有 可 能 调用 的 是 在 另外 一 
个 子 类 中 被 重 写 后 的 版 本 。 在 这 种 情况 下 ， 最 好 是 用 一 种 方式 表示 出 
来 ， 这 个 方法 是 有 可 能 在 其 他 地 方 侦 重 写 的 。 


虽然 模板 特 化 跟 虚 函数 重 写 不 是 一 个 东西 ， 但 它们 很 相似 。 所 
以 ， 一 个 可 以 被 特 化 的 方法 ， 最 好 也 用 一 个 明显 的 标签 显 式 标 记 出 
来 。 这 个 设计 也 可 以 保证 代码 的 前 同 兼 容 性 。 假 如 没有 这 样 的 语法 规 
定 ， 那 么 很 可 能 出 现 的 场景 是 : 以 前 写 的 一 个 库 明 明 执 行 起 来 没 问 
题 ， 现 在 有 了 泛 型 特 化 之 后 ， 跟 其 他 库 一 起 用 到 一 个 项 目 中 ， 束 有 了 
问题 。 比 如 ， 在 某 个 项 目 中 ， 我 们 针对 一 组 类 型 实现 了 某 个 trait， 而 
且 存 在 一 个 变量 调用 了 这 个 trait 内 部 的 方法 。 但 是 如 有 果 我 们 引入 一 个 
新 的 库 ， 这 个 库 针 对 某 具 体 类 型 实现 了 同样 的 trait， 就 意味 着 存在 了 
一 个 更 精确 的 、 更 特 化 的 实现 ， 于 是 原来 项 目 中 调用 的 方法 束 被 悄 无 
声息 地 改变 了 。 如 果 我 们 规定 trait 的 设计 者 本 身 有 权 规 定 自己 的 这 个 
trait (以 及 trait 内 部 的 每 个 方法 ) 是 否 支 持 特 化 ， 就 不 会 出 现 这 个 间 
a 
编 详 销 误 。 


如 果 没 有 default 修 饰 的 话 ， 会 产生 的 新 问题 。Rust 里 impl 块 中 的 方 
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impl<T> Example for T { 
type Output = Box<T>,; 
fn generate(self) -> Box<T> { Box::new(self) } 


} 
此 时 ， 下 面 这 段 调用 应 该 是 可 以 编译 通过 的 : 


fn test(t: bool) -> Box<bool> { 
Example: :generate(t) 


我 们 假设 一 个 针对 bool 类 型 的 特 化 版 本 : 


imp Example for bool { 
type Output = bool,; 


fn generate(self) -> bool { self } 


这 样 就 会 导致 原来 的 test 方 法 编译 失败 ， 因 为 generate 方 法 的 返回 
类 型 变 成 了 bool， 而 不 是 Box<bool>。 如 有 宁 我 们 要 求 使 用 default 天 键 字 
来 标记 是 否 可 以 被 特 化 的 话 ， 这 个 问题 就 可 以 解决 了 : 


impl<T> Example for T { 

default type Output = Box<T>; 

default fn generate(self) -> Box<T> { Box::new(self) } 
} 


// 编译 器 应 该 会 认为 下 面 的 返回 类 型 不 匹配 
fn test(t: bool) -> Box<bool> { 
Example: :generate(t) 


} 


编译 絮 可 以 制定 一 个 这 样 的 规则 ， 如 果 关 联 类 型 前 面 有 default 修 
饰 ， 那 么 调用 generate 方 法 的 返回 值 不 能 直接 当成 Box<T> 类 型 处 理 。 
这 就 可 以 解决 代码 兼容 性 问题 。 


21.7.3 驳 双 impl 


前 面 我 们 已 经 演示 了 什么 是 泛 型 特 化 。 我 们 可 以 利用 泛 型 针对 一 
组 类 型 写 impl， 还 可 以 继续 针对 这 个 集合 中 的 某 一 个 部 分 写 更 特殊 的 
impl。 用 集合 的 韦 恩 图 表示 如 右 图 所 示 : 


但 是 ， 如 采 我 们 写 impl 的 时 候 针 对 的 两 个 集合 并 非 真 子 集 关 系 ， 


而 是 交 集 关 系 ， 怎 么 办 ? 吏 像 右 图 这 样 : 
用 代码 表示 : 


trait Foo {} 
trait B {} 
trait C {} 


// 第 一 个 ijmpl 
impl<T> Foo for T where T: B {} 


// 第 二 个 impl 
impl<T> Foo for T where T: C {} 


此 时 瓯 出 现 了 交叉 的 情况 。 万 一 有 一 个 类 型 满足 T:; B+C 呢 ? 在 调 
用 Foo 中 的 方法 的 时 候 ， 冤 竞选 B 版 本 还 是 选 C 版 本 ?” B 和 C 之 间 不 存在 
继承 关系 ， 它 们 不 古 真 包含 关系 ， 所 以 判断 不 出 究 苋 哪个 更 匹配 、 更 
特殊 、 更 陶 合 。 所 以 在 这 种 情况 下 ， 编 译 右 理应 报错 。 


一 个 交集 规则 : 如果 两 
2 


为 了 解决 这 个 问题 ，Rust 设 计 者 又 提出 了 
个 impl 之 间 存 在 交集 ， 而 且 又 不 是 真 包含 和 关系， 那么 可 以 为 这 


再 写 一 个 impl， 这 样 这 个 impl 就 是 最 特 化 的 那个 版 本 。 即 : 


// 第 三 个 impl 
impl<T> Foo for T where T: B+C {} 


如 果 一 个 类 型 既 满足 B 约 束 ， 又 满足 C 约 束 ， 那 么 与 它 最 匹配 的 
impl 版 本 就 是 新 加 入 的 第 三 个 impl。 


交集 规则 看 起 来 既 简 洛 又 直观 ， 可 惜 它 并 没有 完全 解决 问题 ， 还 
有 一 个 遗留 问题 一 一 跨 项 目 交 互 。 


下 面 有 一 个 比较 复杂 的 例子 ， 来 源 于 Niko 的 博客 。 假 设 我 们 的 项 
目 中 设计 了 一 个 RichDisplay， 它 很 像 标准 库 中 的 Display trait， 但 是 提 
供 了 更 多 的 新 功能 。 我 们 会 为 所 有 已 经 实现 了 Display 的 类 型 来 imp] 我 
们 的 RichDisplay: 


// crate 1 

trait RichDisplay {} 

// impl 1 

impl<T> RichDisplay for T where T: Display {} 


现在 假设 在 男 一 个 项 目 widget 里 面 有 个 类 型 Widget<T>。 它 没有 实 
现 Display， 但 是 我 们 希望 为 它 实 现 RichDisplay。 这 没有 什么 问题 ， 
为 RichDisplay 是 我 们 自己 设计 的 : 


// crate 1 
// impl 2 
impl<T> RichDisplay for Widget<T> where T: RichDisplay 人 


到 这 里 我 们 碰 到 问题 了 ， 第 一 个 impl 和 第 二 个 impl 存 在 “潜在 
的 ”交叉 的 可 能 性 。 第 一 个 impl 是 为 所 有 满足 Display 约 束 的 类 型 实现 
RichDisplay; 第 二 个 impl 是 为 Widget 类 型 实现 RichDisplay。 这 两 个 
impl 针 对 的 类 型 集合 是 有 交叉 的 ， 因 此 应 该 出 现 编译 错误 。 


这 里 的 问题 在 于 ，Widget 类 型 是 在 另外 一 个 项 目 中 定义 的 。 虽 然 
它 现在 没有 impl Display， 但 它 存在 这 样 的 可 能 性 。 也 束 是 说 ，widget 
项 目 加 入 了 以 下 的 代码 ， 也 不 应 该 是 一 个 破坏 性 扩展 : 


// crate widget 
// impl 3 
impl<T> Display for Widget<T> {} 


如 果 这 段 代码 存在 ， 那 么 前 面 的 第 一 个 impl 和 第 二 个 impl 束 冲突 
了 。 所 以 现在 束 有 一 个 困境 上 游 的 widget crate 可 能 在 将 来 加 入 或 者 
不 加 入 这 个 impl， 所 以 目前 第 一 个 impl 和 第 二 个 impl 之 间 的 关系 ， 既 不 
能 被 认为 是 完全 无 和 关 ， 也 不 能 认定 为 泛 型 特 化 。 如 果 设 计 不 当 ， 上 游 
项 目 中 一 个 简单 的 impl 块 ， 有 可 能 引起 下 游 用 户 的 breaking change， 这 
是 不 应 该 出 现 的 。 


所 以 ， 如 末 我 们 要 为 某 些 trait 深 加 默认 实现 ， 而 且 还 想 继续 保持 
| 这 个 问题 惑 必 须 考虑 。 仅 仅 靠 “真子 集 ? 规 则 是 不 


目前 ， 泛 型 特 化 的 完整 规则 依然 处 于 配 配 之 中 ， 它 的 功能 短 时 间 
请 大 家 天 注 RFC 项 目 中 的 相关 提案 ， 跟 踩 最 新 的 讨 
雍 弓 旺 


第 22 章 ” 闭 包 

闭 包 (closure) 是 一 种 匿名 画 数 ， 具 有 “捕获 ”外 部 变量 的 能 力 。 
闭 包 有 时候 也 被 称 作 lambda 表 达 式 。 它 有 两 个 特点 ， (1) 可 以 像 画 数 
性 信 调用 (2) 可 以 捕获 当前 环境 中 的 变量 。Rust 中 的 闭 包 ， 基 本 
语法 如 下 : 


fn main() { 
let add = | a :i32, b:i32 | -> i32 { return a+b; } ; 


let x = add(1,2); 
println!i("result is {}", x); 


可 以 看 到 ， 以 上 闭 包 有 两 个 参数 ， 以 两 个 | 包围 。 执 行 语句 包含 在 
个 中 。 财 包 的 参数 和 返回 值 类 型 的 指定 与 普通 函数 的 语法 相同 。 财 包 
的 参数 和 返回 值 类 型 都 是 可 以 省 略 的 ， 因 此 以 上 闭 包 可 省 略为 : 


let add = |a , b| {return a + b;}; 


和 普通 函数 一 样 ， 返 回 值 也 可 以 使 用 语句 块 表达 式 完 成 ， 与 retum 
语句 的 作用 一 样 。 因 此 以 上 闭 包 可 省 略为 : 


let add = |a, b| {a+b 


更 进一步 ， 如 采 闭 包 的 语句 体 只 包含 一 条 语句 ， 那 么 外 层 的 大 括 
0 


let add = |a, bl a + b; 


closure 看 起 来 和 普通 函数 很 相似 ， 但 实际 上 它们 有 许多 区 别 。 最 
| 区 别 是 ，closure 可 以 “捕获 ”外 部 环境 变量 ， 而 血 不 可 以 。 示 例 
人 下: 


fn main() { 
let x = 1 i32; 


fn inner_add() -> i32 { 
关 直 ,六 
} 


let x2 = inner_add(); 
println!("result is {}", x2); 


编译 ， 出 现 编译 错误 : 


error: can't capture dynamic environment in a fn item; use the || { ... } closure 
form instead [E0434] 


”由 此 可 见 ， 国 数 inner_add 古 不 能 访问 变量 x 的 。 那 么 根据 编 详 恬 的 
提示 ， 我 们 改 为 财 包 试 试 : 


fn main() { 
let x = 1 i32; 


let inner_add = || x+1; 


let x2 = inner_add(); 
println!("result is {}", x2); 


编译 通过 


对 于 不 需要 捕获 环境 变量 的 场景 ， 普 通 函 数 f 和 closure 是 可 以 互 
换 使 用 的 : 


fn main() { 
let option = Some(2); 
let new: Option<i32> = option.map(multiple2); 
println!("{:?}", new); 


fn multiple2(val: i32) -> i32{ val*2 } 


在 上 面 示例 中 ，map 方 法 的 签名 是 : 


fn map<U, F>(self, f; F) -> Option<U> 
where F: Fnonce(T) -> U 


这 里 的 FnOnce 在 下 文中 会 详细 解释 。 它 在 此 处 的 含义 是 : f 是 一 个 
闭 包 参数 ， 类 型 为 FnOnce (T) ->U， 根 据 上 下 文 类 型 推导 ， 实 际 上 是 
FnOnce (i32) ->i32。 我 们 定义 了 一 个 普通 函数 ， 类 型 为 pn (i32) - 
” 也 可 以 用 于 该 参数 中 。 如 果 我 们 用 闭 包 来 写 ， 下 面 这 样 写 也 可 


let new: Option<i32> = option.map(|val| val * 2); 


普通 函数 和 闭 包 之 间 最 大 的 区 别 是 ， 普 通 函 数 不 可 以 捕获 环境 变 
量 。 在 上 面 的 例子 中 ， 虽 然 我 们 的 multiple2 函 数 定义 在 main 函 数 体 
内 ， 但 是 它 无 权 访 问 main 函 数 内 的 局 部 变量 。 其 次 ， 包 定义 和 调用 的 
位 置 并 不 重要 ，Rust 中 是 不 需要 前 回声 明 的 。 只 要 函数 定义 在 当前 范 
围 内 是 可 以 观察 到 的 ， 束 可 以 直接 调用 ， 不 管 在 源码 内 的 相对 位 置 如 
人 closure 更 像 是 一 个 的 变量 ， 它 只 有 和 变量 同样 的 “生命 


22.1 变量 捕获 


接 下 来 我 们 研究 一 下 closure 的 原理 。Rust 目 前 的 closure 实 现 ， 又 
叫 作 unboxed closure， 它 的 原理 与 C++11 的 lambda 非 党 相似 。 当 一 个 
closure 创 建 的 上 时候 ， 编 译 器 帮 我 们 生成 了 一 个 匿名 struct 类 型 ， 通 过 目 
动 分 析 closure 的 内 部 逻辑 ， 来 决定 该 结构 体 包 括 哪些 数据 ， 以 及 这 些 
数据 该 如 何 初始 化 。 


考虑 以 下 例子 : 


fn main() { 
let x = 1 i32; 
let add x= |a|x+a; 
let result = add x( 5 ); 
println!("result is {}", result); 


我 们 来 思考 一 下 : 如 果 不 使 用 财 包 来 实现 以 上 逻辑 ， 该 怎么 做 ? 
方法 如 下 : 


Struct Closure { 
Inner1: i32 


impl Closure { 
fn call(&self, a: i32) -> i32 { 
self,.inner1 + a 
} 
} 


fn main() { 
let x = 1 i32; 
let add x = Closure{ inner1: x}; 
let result = add x.call(5); 
println!("result is {}", result); 


} 


上 面 这 个 例子 ， 我 们 模拟 了 一 个 财 包 的 原理 ， 实 际 上 Rust 编 译 套 
就 是 用 类 似 的 手法 来 处 理财 包 语 法 的 。 对 比 一 下 使 用 财 包 语 法 的 版 本 
和 手动 实现 的 版 本 ， 我 们 可 以 看 到 ， 创 建 闭 包 的 时 候 ， 束 相当 于 创建 
了 一 个 结构 体 ， 我 们 把 需要 捕获 的 环境 变量 存 到 这 个 结构 体 中 。 闭 包 
调用 的 时 候 ， 相 当 于 调用 了 跟 这 个 结构 体 相 关 的 一 个 成 员 画 数 。 


但 是 ， 还 有 几 个 问题 没有 解决 。 当 编译 器 把 财 包 语法 糖 转换 为 普 
通 的 类 型 和 函数 调用 的 时 候 : 


(1) 结构 体内 部 的 成 员 应 该 用 什么 类 型 ， 如 何 初 始 化 ? 应 该 用 
i32 或 是 &i32 还 是 &mut i32? 


(2) 函数 调用 的 时 候 self 应 该 用 什么 类 型 ? 应 该 写 self 或 是 &self 


还 是 &mut self? 
理解 了 这 两 个 问题 的 答案 ， 束 能 完全 理解 了 Rust 的 闭 包 的 原理 。 


天 于 第 一 个 问题 ，Rust 主 要 钙 通 过 分 析 外 部 变量 在 闭 包 中 的 使 用 
方式 ， 通 过 一 系列 的 规则 目 动 推导 出 来 的 。 主 要 规则 如 下 : 


(1) 如 果 一 个 外 部 变量 在 闭 包 中 ， 只 通过 借用 指针 & 使 用 ， 那 么 
这 个 变量 就 可 通过 引用 & 的 方式 捕获 ; 


(2) 如 果 一 个 外 部 变量 在 闭 包 中 ， 通 过 &mut 指 针 使 用 过 ， 那 么 
个 变量 就 需要 使 用 &mut 的 方式 捕获 ; 


(3) 如 果 一 个 外 部 变量 在 闭 包 中 ， 通 过 所 有 权 转 移 的 方式 使 用 
过 ， 那 么 这 个 变量 就 需要 使 用 “by value”self 的 方式 捕获 。 


简单 点 总 结 规则 是 ， 在 保证 能 编译 通过 的 情况 下 ， 编 译 右 会 目 动 
， 种 对 外 部 影 啊 最 小 的 类 型 存储 。 对 于 被 捕获 的 类 型 为 T 的 外 部 
在 匿名 结构 体 中 的 存储 方式 选择 为 : 尽 可 能 先 选 择 &T 类 型 ， 其 
a T 类 型 ， 最 后 选择 T 类 型 。 示 例如 下 : 


struct T(i32); 


fn by_value(_: T) 全 
fn by_mut(_: &mut T) 癸 } 
fn by_ref(_: &T) {} 


fn main() { 
let x: T = T(1); 
let y: T = T(2); 
let mut z: T = T(3); 


let closure = || { 
by_value(x); 
by_ref (&y); 
by_mut(&mut z); 


closure( ); 


以 上 闭 包 捕获 了 外 部 的 三 个 变量 xyz。 其 中 ，y 通 过 &T 的 方式 被 
使 用 了 ; z 通 过 &mut pd 了 ; X 通 过 TI 的 方式 被 使 用 了 。 编 
译 器 会 根据 这 些 信息 ， 自 动 生成 结构 类 似 下 面 这 样 的 匿名 结构 体 : 


// 实际 类 型 名 字 是 编译 器 按 某 些 规则 自动 生成 的 
struct ClosureEnvironment<'y, 'z> { 


xX: Ty 

y: &'yT, 
Z: &'z mut TT, 
} 


”而 原 示 例 中 的 closure 这 个 局 部 变量 ， 束 古 这 个 类 型 的 实例 。 对 我 
们 来 说 ， 这 个 类 型 是 匿名 的 。 


22.2 ”move 关 键 字 


以 上 变量 捕获 的 规则 都 是 针对 只 作为 局 部 变量 的 闭 包 而 准备 的 。 
有 些 时 候 ， 我 们 的 闭 包 的 生命 周期 可 能 会 超过 一 个 函数 的 范围 。 比 
如 ， 我 们 可 以 将 此 团 包 存 储 到 某 个 数据 结构 中 ， 在 当前 函数 返回 之 后 
继续 使 用 。 这 样 一 来 ， 就 可 能 出 现 更 复业 的 情况 ， 在 闭 包 被 创建 的 时 
候 ， 它 通过 引用 的 方式 捕获 了 某 些 局 部 变量 ， 而 在 闭 包 被 调用 的 时 
候 ， 它 所 指 癌 的 一 些 外 部 变量 已 经 被 释放 了 。 示 例如 下 : 


fn make_adder(x: i32) -> Box<FnN(i32) -> i32> { 
Box::new(|y| x + y) 


fn main() { 
let f = make_adder(3); 


printin!1("{}", f(1)); // 4 
printin!1("{}", f(10)); // 13 


大 家 可 以 看 到 ， 画 数 make_adder 中 有 一 个 局 部 变量 x， 按 照 前 面 所 
述 的 规则 ， 它 被 财 包 所 捕获 ， 而 且 可 以 使 用 引用 区 的 方式 完成 团 包 内 
部 的 逻辑 ， 因 此 它 是 被 引用 捕获 的 。 而 闭 包 则 作为 函数 返回 值 被 传递 
出 去 了 。 于 是 ， 闭 包 被 调用 的 时 候 ， 它 内 部 的 引用 所 指 癌 的 内 容 已 经 
被 释放 了 。 这 种 情况 ， 应 该 会 出 现 典 型 的 时 指针 问题 ， 属 于 内 存 不 安 
UU 。 笠 运 的 是 ， 该 程序 在 Rust 中 根本 无 法 编译 通过 ， 错 误 信 息 


error: closure may outlive the current function, but it borrows `“X ，Wwhich is 
owned by the current function [E0373] 


轩 信息 提示 得 非常 清晰 ， 我 们 又 可 以 感谢 Rust 帮 我 们 发 现 了 一 个 问 


牛人 。 


那么 这 种 情况 ， 我 们 应 该 怎样 写 才 对 呢 ? 这 里 要 介绍 一 个 新 的 天 
键 子 move， 它 的 功能 是 用 于 修饰 一 个 闭 包 。 示 例如 下 : 


fn make_adder(x: i32) -> Box<Fn(I32) -> i32> { 
Box::new(move |y| x + y) 
> AAA 


// 注意 这 里 


} 


加 上 move 关 键 字 之 后 ， 所 有 的 变量 捕获 全 部 使 用 by value 的 方 
式 。 也 就 是 说 ， 编 译 器 生成 的 匿名 结构 体内 部 看 起 来 像 是 下 面 这 样 : 


struct ClosureEnvironment { 
x: TYPE1, // 
y: TYPE2， // 这 里 没有 &TYPE, &mut TYPE, 所 
z: TYPE3, // 


被 捕获 的 外 部 变量 所 有 权 一 律 转移 进 闭 包 


x 


} 


所 以 ，move 天 键 字 可 以 改变 闭 包 捕获 变量 的 方式 ， 一 般 用 于 闭 包 
需要 传递 到 函数 外 部 (escaping closure) 的 情况 。 


22.3 Fn/FnMut/FnOnce 


外 部 变量 捕获 的 问题 解决 了 ， 我 们 再 看 看 第 二 个 问题 ， 闭 包 被 调 
用 的 方式 。 我 们 注意 到 ， 闭 包 被 调用 的 上 时候， 不 需要 执行 某 个 成 员 函 
数 ， 而 是 采用 类 似 函 数 调 用 的 语法 来 执行 。 这 是 因为 它 目 动 实 现 了 编 
译 絮 提供 的 几 个 特殊 的 trait，Fn 或 者 FnMut 或 者 FnOnce 。 


注意 : 小 写 血 是 天 键 字 ， 用 于 声明 丽 数 ， 大 写 的 Fn 不 是 关键 字 ， 
只 是 定义 在 标准 库 中 的 一 个 trait 。 
下 


们 的 定义 如 下 : 


pub trait Fnonce<Args> { 
type Output; 
extern "rust-call" fn call once(self, args: Args) -> Self::Output,; 


} 


pub trait FnMut<Args> : Fnonce<Args> { 
extern "rust-call" fn call mut(&mut self, args: Args) -> Self::Output; 
} 


pub trait Fn<Args> : FnMut<Args> { 
extern "rust-call" fn call(&self, args: Args) -> Self::Output; 
} 


这 几 个 trait 的 主要 区 别 在 于 ， 被 调用 的 时 候 self 参 数 的 类 型 。 
FnOnce 被 调用 的 时 候 ，self 是 通过 move 的 方式 传递 的 ， 因 此 它 被 调用 
之 后 ， 这 个 财 包 的 生命 周期 融 已 经 结束 了 ， 它 只 能 被 调用 一 次 ; 
FnMut 被 调用 的 时 候 ，self 是 &mut Self 类 型 ， 有 能 力 修改 当前 闭 包 本 身 
的 成 员 ， 甚 至 可 能 通过 成 员 中 的 引用 ， 修 改 外 部 的 环境 变量 ，Fn 被 调 
用 的 时 候 ，self 是 &Self 类 型 ， 只 有 读 取 环境 变量 的 能 力 。 


目 前 这 几 个 trait 不 处 于 unstable 状 态 ° 在 目前 的 稳定 版 编译 絮 中 ， 
我 们 不 能 针对 上 自 定 义 的 类 型 实现 这 几 个 trait， 只 能 在 nightly 版 本 中 开启 
#! [feature (fn traits) ] 功 能 。 


那么 ， 对 于 一 个 闭 包 ， 编 译 右 十 如 何 选择 impl 哪 个 trait 呢 ? 答案 


是 ， 编 译 器 会 都 尝 斌 一遍， 实现 能 让 程序 编译 通过 的 那 几 个 。 闭 包 调 
用 的 时 候 ， 会 尽 可 能 先 选 择 调用 fn call (&self，args: Args) 函数 ， 其 


次 尝试 选择 fn call_mut (&self，args: Args) 函数 ， 最 后 尝试 使 用 fn 
call_once (self，args: Args) 函数 。 这 些 都 是 编译 器 自动 分 析出 来 
隐 。 


还 是 用 示例 来 讲解 比较 清晰 : 


fn main() { 
let v: Vec<i32> = vec![]; 
let c= || std::mem::drop(v); 
c(); 

} 


对 于 上 例 ，drop 函 数 的 签名 是 所 drop<T> (_x: T) ， 它 接受 的 参 
数 类 型 是 T。 因 此 ， 在 闭 包 中 使 用 该 范 数 会 导致 外 部 变量 v 通 过 move 的 
方式 被 捕获 。 编 译 需 为 该 闭 包 目 动 生 成 的 匿名 类 型 ， 类 似 下 面 这 样 : 


struct ClosureEnvironment { 
vV: Vec<i32> // 这 里 不 是 引 
} 


对 于 这 样 的 结构 体 ， 我 们 来 尝试 实 现 FnMut trait: 


impl] FnMut<Vec<i32>> for ClosureEnvironment { 
extern "rust-call" fn call mut(&mut self, args: Args) -> Self::Output { 
drop(self.v) 
} 
} 


当然 ， 这 是 行 不 通 的 ， 因为 钞 数 体内 需要 一 个 Self 类 型 ， 但 是 函 
数 参 数 只 提供 了 &mut Self 类 型 。 因 此 ， 编 译 器 不 会 为 这 个 闭 包 实现 
FnMaut trait。 唯 一 能 实现 的 trait 束 只 剩 下 了 FnOnce。 


这 个 闭 包 被 调用 的 时 候 ， 当 然 就 会 调用 call_once 方 法 。 我 们 知 
道 ，fn call_once (self，arg: Args) 这 个 函数 被 调用 的 时 候 ，self 参 数 
是 move 进 入 函数 体 的， 会 “ 吃 掉 ”self 变 量 。 在 此 函数 调用 后 ， 这 个 闭 
包 的 生命 周期 就 结束 了 。 所 以 ，FnOnce 类 型 的 财 包 只 能 被 调用 一 次 。 
FnOnce 也 是 得 名 于 此 。 我 们 目 己 来 试 一 下 : 


fn main() { 


let v: Vec<i32> = vec![]; 

let c = || drop(v); // 闭 包 使 用 捕获 变量 的 方式 ,决定 了 这 个 闭 包 的 类 型 。 它 只 实现 了 `Fnonce 
trait 。 

c(); 


c(); // 再 调用 一 次 试 试 , 编译 错误 use of moved value: `c 。'c、 


怎么 被 move 走 的 ? 


计 


} 


编译 器 在 处 理 上 面 这 段 代 码 的 时 候 ， 做 了 一 个 下 面 这 样 的 展开 : 


fn main() { 
struct ClosureEnvironment { 
_V: Vec<i32> 
let v: Vec<i32> = vec![]; 
let c = ClosureEnvironment { _v: v }; // v move 进入 了 c 的 成 员 中 
c.call _once(); // c move 进入 了 call_once 方法 中 
c.call_once(); // c 的 生命 周期 已 经 结束 了 , 这 里 的 调用 会 发 生 编译 错误 
} 


同样 的 道理 ， 我 们 试 试 Fn 的 情况 : 


fn main() { 
let v: Vec<i32> = vec![1,2,3]; 
let c= || for i in &v { printjn!t("{}", 1i); }; 
c(); 
c(); 
} 


可 以 看 到 ， 上 面 这 个 闭 包 捕获 的 环境 变量 在 使 用 的 时 候 ， 只 需要 
&Vec<i32> 类 型 即 可 ， 因 此 它 只 需要 捕获 环境 变量 v 的 3 引用。 因此 它 能 
实现 Fn trait。 闭 包 在 被 调用 的 上 时候， 执行 的 是 fn call (&self) 范 数 ， 
所 以 ， 调 用 多 次 也 是 没 问题 的 。 


我 们 如 果 给 上 面 的 程序 添加 move 关 键 字 ， 依 然 可 以 通过 : 


fn main() { 
let v: Vec<i32> = vec![1,2,3]; 
let c = move || for i in &v { printin!("{}", i); }; 
c(); 
c(); 


可 以 看 到 ，move 关 键 字 只 是 影响 了 环境 变量 被 捕获 的 方式 。 第 三 
行 ， 创 建 闭 包 的 时 候 ， 变 量 v 被 move 进 入 了 闭 包 中 ， 闭 包 中 捕获 变量 
包括 了 一 个 拥有 所 有 权 的 Vec<i32>。 第 四 行 ， 闭 包 调 用 的 时 候 ， 根 据 
推断 规则 ， 它 依然 是 Fn 型 的 闭 包 ， 使 用 的 是 fn call (&self) 函数 ， 
此 闭 包 变量 c 可 以 被 多 次 调用 。 


22.4 闭 包 与 沁 型 


我 们 已 经 知道 ， 闭 包 是 依靠 trait 来 实现 的 。 跟 普通 trait 一 样 ， 我 们 
不 能 直接 用 Fn FnMut FnOnce 作 为 变量 类 型 、 函 数 参数 、 画 数 返 回 值 。 


跟 其 他 的 trait 相 比 ， 闭 包 相 关 的 trait 语 法 上 有 特殊 之 处 。 比 如 ， 如 
果 我 们 想 让 财 包 作 为 一 个 参数 传递 到 函数 中 ， 可 以 这 样 写 : 


fn call with closure<F>(some_closure: F) -> i32 
where F : Fn(i32) -> i32 { 
some_closure(1) 


} 


fn main() { 
let answer = call with closure(|x| x + 2); 
println!("{}", answer); 


其 中 泛 型 参数 F 的 约束 条 件 是 F:; Fn (i32) ->i32。 这 里 Fn (i32) - 
>i32 是 针对 闭 包 设 计 的 专门 的 语法 ， 而 不 是 像 普通 trait 那 样 使 用 
Fn<i32，i32> 来 写 。 这 样 设 计 为 了 让 它们 看 起 来 跟 普通 函数 类 型 fn 

(i32) ->i32 更 相似 。 除 了 语法 之 外 ，Fn FnMut FnOnce 其 他 方面 都 跟 
普通 的 泛 型 一 致 。 


一 定 要 注意 的 是 : 每 个 闭 包 ， 编 译 器 都 会 为 它 生 成 一 个 匿名 结构 
体 类 型 ， 即 使 两 个 财 包 的 参数 和 返回 值 一 致 ， 它 们 也 十 完全 不 同 的 两 
个 类 型 ， 只 是 都 实现 了 同一 个 trait 而 已 。 下 面 我 们 用 一 个 示例 演示 : 


fn main() { 

// 同一 个 变量 绑 定 了 两 次 
let mut closure = |x : i32| -> i32 {x+2}; 
closure = |x: i32| -> i32 {x-20},) 
println!("{}", closure()); 


编译 ， 结 有 果 出 错 ， 错 误 信 息 为 : 


error: mismatched types: 
expected [closure@temp.rs:3:21: 3:47],, 
found “~ [closureQ@temp ,rs:4:13: 4:38]. 


(expected closure, 
found a different closure) [E0308] 


可 以 看 到 ， 我 们 用 同一 个 变量 来 绑 定 两 个 闭 包 的 时 候 发 生 了 类 型 
着 误 。 请 大 家 牢 牢记 住 ， 不 同 的 闭 包 是 不 同 的 类 型 。 


既然 如 此 ， 跟 普通 的 trait 一 样 ， 如 采 我 们 需要 加 画 数 中 传递 财 
有 下 面 两 种 方式 。 


:通过 泛 型 的 方式 。 这 种 方式 会 为 不 同 的 闭 包 参 数 类 型 生成 不 同 版 
本 的 函数 ， 实 现 静 仿 分 派 。 


.通过 trait object 的 方式 。 这 种 方式 会 将 闭 包 装 箱 进 入 堆 内 存 中 ， 
回 函 数 传 递 一 个 胖 指针 ， 实 现 运行 期 动态 分 派 。 


天 于 动态 分 派 和 静态 分 派 的 内 容 ， 将 在 下 一 草 中 详细 说 明 。 此 处 
只 做 一 个 简单 示例 : 


fn static_dispatch<F>(closure: &F) // 这 里 是 泛 型 参数 。 对 于 每 个 不 同类 型 的 参数 , 编译 器 将 会 
生成 不 同 版 本 的 函数 
where F: Fn(i32) -> i32 


println!("static dispatch {}", closure(42)); 


fn dynamic_dispatch(closure: &Fn(i32)->i32) // 这 里 是 `trait object ` `Box<Fn(i32)- 
>i32>` 也 算 `trait object、。 


println!("dynamic dispatch {}", closure(42)); 


fn main() { 
let Closure1 = | x | x* 2; 
let closure2 = | x |x* 3; 
fn function_ptr(x: i32)->i32 { x * 4 }; 


static dispatch(&closure1),; 
static dispatch(&closure2); 
static_dispatch(&function_ptr); // 普通 `fn 函数 也 实现 了 `Fn trait., 它 可 以 与 此 参数 类 
型 匹配 。`fn :不 可 以 捕获 外 部 变量 


dynamic_dispatch(&closure1); 

dynamic_dispatch(&closure2); 

dynamic_dispatch(&function_ptr); 
} 


如 采 我 们 希望 一 个 闭 包 作为 函数 的 返回 值 ， 那 么 就 不 能 使 用 泛 型 
的 方式 了 。 因 为 如 条 泛 型 类 型 不 在 参数 中 出 现 ， 而 仅 在 返回 类 型 中 出 
现 的 话 ， 会 要 求 在 调用 的 时 候 显 式 指定 类 型 ， 编 译 万 才能 完成 类 型 推 
叶 。 可 是 调用 方 根本 无 法 指定 具体 类 型 ， 因 为 团 包 类 型 是 匿名 类 型 ， 
用 户 无 法 显 式 指定 。 所 以 下 面 这 样 的 写法 是 编译 不 过 的 : 


fn test<F>() -> F 
where F: Fn(i32)->i32 


return | i | i* 2,; 


fn main() { 
let closure = test(); 


} 


修复 这 段 代码 有 两 种 方案 ， 一 种 是 静态 分 派 ， 一 种 是 动态 分 派 。 


:静态 分 派 。 我 们 可 以 用 一 种 新 的 语法 fn test () ->implFn (i32) - 
>i32 来 实现 。 在 后 面 的 章节 中 有 这 个 语法 糖 的 详细 介绍 。 


:动态 分 派 。 ° 就 是 把 闭 包 装 箱 进 入 堆 内 存 中 ， 使 用 Box<dyn Fn 
(i32) ->i32> 这 种 trait object 类 型 返回 。 关 于 trait object 的 内 容 可 参见 
下 


\ 


fn test() -> Box<dyn Fn(i32)->i32 > 
{ 


let c= | i: i32 | i * 2,; 
Box: :new(c) 


} 


fn main() { 
let closure = test(); 
let r = closure(2); 
println!("{}", r); 

} 


22.5” 闭 包 与 生命 周期 


当 使 用 闭 包 做 参数 或 返回 值 的 时 候 ， 生 命 周期 会 变 得 更 加 复杂 。 
假设 有 下 面 这 段 代 码 : 


fn calc_by<'a, F>(var: &'a i32, f: F) -> i32 
where F: Fn(&'a i32) -> i32 


f(var) 


fn main() { 
let local = 10; 
let result = calc_ by(&local, |i| i*2); 
println!("{}", result); 


这 段 代 码 可 以 编译 通过 。 但 是 ， 假 如 我 们 把 calc_by 的 函数 体 稍 微 
改 一 下 ， 变 成 下 面 这 样 : 


let local = *var,; 
f(&local) 


忠 不 能 编译 通过 了 
但 是 ， 如 果 我 们 把 所 有 的 生命 周期 标记 去 掉 ， 变 成 这 样 : 


fn calc_by<F>(var: &i32, f: F) -> i32 
where F: Fn(&i32) -> i32 


let local = *var,; 
f(&local) 


fn main() { 
let local = 10; 
let result = calc by(&local, |i| i*2); 
println!("{}", result); 

} 


它 束 又 可 以 编译 通过 了 。 这 说 明 ， 我 们 前 面 对 这 个 calc_by 函 数 手 
写 的 生命 周期 标记 有 问题 。 


对 于 上 面 这 个 例子 ， 所 有 的 借用 生命 周期 都 症 由 编译 套 目 动 补 全 
的 ， 假 如 我 们 手动 来 补 全 这 些 标 记 ， 应 该 怎么 做 呢 ? 


在 这 里 我 们 只 能 使 用 “高 阶 生命 周期 ”的 表示 方法 : 


fn calc_by<'a, F>(var: &'a i32, f: F) -> i32 
where F: for<'f> Fn(&'f i32) -> i32 

{ 
let local = *var; 
f(&local) 


注意 F 的 约束 条 件 ， 这 样 写 表示 的 意思 和 是，Fn 的 输入 参数 可 作用 
这 个 生命 周期 和 男 外 一 个 参数 var 的 生命 周期 没 


这 才 是 这 段 代 码 正确 的 生命 周期 标记 方式 。 如 采 我 们 不 手动 标记 
0 编译 需 为 我 们 目 动 推导 的 生命 周期 天 系 束 是 这 样 的 高 阶 生命 周 


谈 到 “高 阶 ” 这 两 个 字 ， 很 多 朋友 会 想到 高 阶 类 型 (higher kinded 
types) 。 这 里 的 高 阶 生 命 周 期 确实 跟 高 阶 类 型 有 很 多 相似 之 处 ，Rust 
也 确实 在 思考 如 何 引入 高 阶 类 型 这 个 问题 ， 但 还 没有 做 出 最 终 决 定 。 
到 目前 为 止 ，for<'a>Fn (&'a Arg) ->&'a Ret 这 样 的 语法 ， 只 能 用 于 生 
命 周 期 参数 ， 不 能 用 于 任意 泛 型 类 型 。 


第 23 章 ”动态 分 派 和 静态 分 派 


Rust 可 以 同时 支持 “静态 分 派 ”(static dispatch) 和 “动态 分 
派 ” (dynamic dispatch) 。 


所 谓 “ 静 人 态 分 派 "”， 是 指 具 体 调用 哪个 画 数 ， 在 编译 阶段 就 确定 下 
来 了 。Rust 中 的 “静态 分 派 ? 靠 泛 型 以 及 impl trait 来 完成 。 对 于 不 同 的 沁 
型 类 型 参数 ， 编 译 强 会 生成 不 同 版 本 的 画 数 ， 在 编译 阶段 惑 确 定好 了 
应 该 调用 哪个 函数 。 


所 谓 “ 动 仿 分 派 ”， 十 指 具体 调用 哪个 力 数 ， 在 执行 阶段 才能 确 
定 。Rust 中 的 “动态 分 派 * 靠 Trait Object 来 完成 。Trait Object 本 质 上 是 指 
ER 指 回 的 具体 类 型 不 同 ， 调 用 的 方法 也 驶 


我 们 用 一 个 示例 来 说 明 。 假 设 我 们 有 一 个 trait Bird， 有 另外 两 个 
类 型 都 实现 了 这 个 trait， 我 们 要 设计 一 个 画 数 ， 既 可 以 接受 Duck 作 为 
参数 ， 也 可 以 接受 Swan 作 为 参数 。 


trait Bird { 
fn fly(&self); 


Struct Duck 
struct Swan; 
impl Bird for Duck { 
fn fly(&self) { println!("duck duck"); } 


impl Bird for Swan 
fn fly(&self) { println!("swan swan");} 


目 完 ， 大 家 需要 牢 牢记 住 的 一 件 事 情 症 ，trait 十 一 种 DST 类 型 ， 它 
的 大 小 在 编译 阶段 是 不 固定 的 。 这 意味 着 下 面 这 样 的 代码 是 无 法 编译 


通过 的 : 


fn test(arg: Bird) 人 
fn test() -> Bird { 


因为 Bird 是 一 个 trait， 而 不 是 具体 类 型 ， 它 的 size 无 法 在 编译 阶段 
确定 ， 所 以 编译 硕 是 不 允许 直接 使 用 trait 作 为 参数 类 型 和 返回 类 型 


的 。 这 也 是 trait 跟 许多 语言 中 的 “interface” 的 一 个 区 别 。 


这 种 时 候 我 们 有 两 种 选择 。 一 种 是 利用 泛 型 : 


fn test<T: Bird>(arg: T) { 
arg.fly(); 


这 样 ，test 函 数 的 参数 既 可 以 是 Duck 类 型 ， 也 可 以 是 Swan 类 型 。 
实际 上 ， 编 译 喜 会 根据 实际 调用 参数 的 类 型 不 同 ， 直 接生 成 不 同 的 函 
数 版 本 ， 类 似 C++ 中 的 template: 


// 伪 代 码 示意 
fn test_Duck(arg: Duck) { 
arg.fly(); 


fn test_Swan(arg: Swan) { 
arg.fly(); 


所 以 ， 通 过 泛 型 画 数 实现 的 “多 态 ”， 是 在 编 详 阶 段 束 已 经 确定 好 
了 调用 哪个 版 本 的 函数 ， 因 此 被 称 为 “ 议 仿 分 派 "。 除了 沁 型 之 外 ， 
Rust 还 提供 了 一 种 impl Trait 语 法 ， 也 能 实现 静态 分 派 。 


我 们 还 有 另外 一 种 办 法 来 实现 “多 态 "”， 那 殴 是 通过 指针 。 虽然 trait 
征 DST 类 型 ， 但 是 指 回 trait 的 指针 不 是 DST。 如 果 我 们 把 trait 隐 藏 到 指 
那 它 束 是 一 个 trait object， 而 它 是 可 以 作为 参数 和 返回 类 型 


// 根据 不 同 需求 , 可 以 用 不 同 的 指针 类 型 ,如 Box/&/&mut 等 
fn test(arg: Box<dyn Bird>) { 
arg.fly(); 


在 这 种 方式 下 ，test 函 数 的 参数 既 可 以 是 Box<Duck> 类 型 ， 也 可 以 
征 Box<Swan> 类 型 ， 一 样 实现 了 “多 态 ”。 但 在 参数 类 型 这 里 已 经 将 “ 具 
体 类 型 ”信息 抹 掉 了， 我 们 只 知道 它 可 以 调用 Bird trait 的 方法 。 而 具体 


调用 的 是 哪个 版 本 的 方法 ， 实 际 上 有 是 由 这 个 指针 的 值 来 决定 的 。 这 丈 


23.1 trait object 


什么 是 trait object 呢 ? 指 同 trait 的 指针 束 是 trait object。 假 如 Bird 是 
一 个 trait 的 名 称 ， 那 么 dyn Bird 就 是 一 个 DST 动 态 大 小 类 型 。&dyn 
Bird 、&mut dyn Bird 、 Box<dyn Bird> 、*const dyn Bird 、*mut dyn Bird 
以 及 Rc<dyn Bird> 等 等 都 是 Trait Object 。 


S 注意 dyn 是 一 个 新 引入 的 上 下 文 关 键 字 (Contextual 
keyword) ， 目 前 还 没有 稳定 。 用 户 需 要 手动 打开 #! [feature 
(dyn_trait) ] 才 能 使 用 。 目 前 的 trait object 默 认 的 语法 是 没有 dyn 关 键 
字 的 。 


trait object 这 个 名 字 以 后 也 会 被 改 为 dynamic trait type。impl Trait 
for Trait 这 样 的 语法 同样 会 被 改 为 Impl Trait for dyn Trait。 这 样 能 更 好 
地 跟 impl Trait 语 法 对 应 起 来 。 


当 指 针 指向 trait 的 时 候 ， 这 个 指针 就 不 是 一 个 普通 的 指针 了 ， 变 
成 一 个 “ 胖 指 针 ”。 请 大 家 回忆 一 下 前 文 所 讲解 的 DST 类 型 ， 数 组 类 型 
[T] 是 一 个 DST 类 型 ， 因 为 它 的 大 小 在 编译 阶段 是 不 确定 的 ， 相 对 应 
的 ，&[T] 类 型 就 是 一 个 " 胖 指针 ”， 它 不 仅 包含 了 指针 指向 数组 的 其 中 
二 个 元 素 ， 同 时 包含 一 个 长 度 信息 * 它 的 内 部 表示 实质 上 是 Slice 类 


同 理 ，Bird 只 是 一 个 trait 的 名 字 ， 人 符合 这 个 trait 的 具体 类 型 可 能 
多 种 ， 这 些 类 型 并 不 具备 同样 的 大 小 ， 因 此 使 用 dyn Bird 来 表示 满足 
Bird 约 束 的 DST 类 型 。 指 向 DST 的 指针 理所当然 也 应 该 是 一 个 “ 胖 指 
针 ”， 它 的 名 字 束 叫 trait object。 比 如 Box<dyn Bird>， 它 的 内 部 表示 可 
以 理解 成 下 面 这 样 : 


pub struct Traitobject f{ 
pub data: *mut (), 
pub vtable: *mut (), 

} 


它 里 面包 含 了 两 个 成 员 ， 都 是 指 回 单元 类 型 的 襟 指针 。 在 这 里 声 
明 的 指针 指 同 的 类 型 并 不 重要 ， 我 们 只 需 知道 它 里 面包 含 了 两 个 裸 指 


针 即 可 。 由 上 可 见 ， 和 Slice 一 样 ，Trait Object 除了 包含 一 个 指针 之 
外 ， 还 带 有 另外 一 个 “元 数据 "”， 它 残 是 指 问 “ 虚 函 数 表 ” 的 指针 。 这 里 
用 的 是 裸 指针 ， 指 向 unit 类 型 的 指针 *mut () 实际 上 类 似 于 C 语 言 中 的 
void*。 我 们 来 尝试 一 下 使 用 unsafe 人 代码， 如果 把 它 里 面 的 数值 当成 整 
数 拿 出 来 会 是 什么 结 


#![feature(dyn_trait)] 
use std::mem; 
trait Bird { 
fn fly(&self); 
struct Duck; 
struct Swan; 
impl Bird for Duck 区 
fn fly(&self) { println!("duck duck"); } 


impl Bird for Swan { 
fn fly(&self) { println!("swan swan");} 


// 参数 是 trait object 类 型 ,p 是 一 个 胖 指针 
fn print_traitobject(p: &dyn Bird) { 


// 使 用 transmute 执 行 强制 类 型 转换 , 把 变量 p 的 内 部 数据 取出 来 
let (data, vtable) : (usize, * const usize) = unsafe {mem::transmute(p)}; 
println!("TraitObject [data:{}, vtable:{:p}]", data, vtable); 
unsafe 区 
// 打印 出 指针 v 指向 的 内 存 区 间 的 值 
println!("data in vtable [人 人， 癸 ， 人 他 ， 癸 ] 
*vtable, *vtable.offset(1), *vtable.offset(2), *vtable.offset(3)); 


} 


fn main() { 

let duck = Duck; 

let p_duck = &duck; 

let p_bird = p_duck as &dyn Bird; 

println!("Size of p_duck {}, Size of p_bird {}", mem::size of val(&p_duck), 
mem: :size_of_val(&p_bird)); 


let duck_fly : usize = Duck::fly as usize,; 
let swan_fly : usize = Swan::fly as usize,; 
println!("Duck::fly {}", duck_fly); 
println!("Swan::fly {}", swan_fly); 


print_traitobject(p_bird); 
let swan = Swan; 
print_traitobject(&swan as &dyn Bird); 


执行 结果 为 : 


Size of p_duck 8, Size of p_bird 16 
Duck: :fly 139997348684016 
Swan::fly 139997348684320 


TraitObject [data:140733800916056, vtable:139997351089872] 
data in vtable [139997348687008, 0, 1, 139997348684016] 
TraitObject [data:140733800915512, vtable:139997351089952] 


data in vtable [139997348687008, 0, 1, 139997348684320] 


我 们 可 以 看 到 ， 直 接 针 对 对 象 取 指 针 ， 得 到 的 是 普通 指针 ， 它 占 
据 64 bit 的 空间 。 如 果 我 们 把 这 个 指针 使 用 as 运算 符 转 换 为 trait object， 
它 束 成 了 胖 指 针 ， 携 沉 了 额外 的 信息 。 这 个 额外 信息 很 重要 ， 因 为 我 
们 还 需要 使 用 这 个 指针 调用 函数 。 如 采 指 回 trait 的 指针 只 包含 了 对 象 
的 地 址 ， 那 么 它 就 没 办 法 实现 针对 不 同 的 具体 类 型 调用 不 同 的 函数 
了 。 所 以 ， 它 不 仅 要 包含 一 个 指 癌 真 实 对 象 的 指针 ， 还 要 有 一 个 指 同 
所 谓 的 “ 虚 函 数 表 ” 的 指针 。 我 们 把 虚 函 数 表 里 面 的 内 容 打 印 出 来 可 以 
看 到 ， 里 面 有 我 们 需要 被 调用 的 具体 轴 数 的 地 址 。 


从 这 里 的 分 析 结 果 可 以 看 到 ，Rust 的 动态 分 派 和 C++ 的 动态 分 
派 ， 内 存 布局 有 所 不 同 。 在 C++ 里 ， 如 采 一 个 类 型 里 面 有 虚 函 数 ， 那 
么 每 一 个 这 种 类 型 的 变量 内 部 都 包含 一 个 指 回 虚 函数 表 的 地 址 。 而 在 
Rust 里 面 ， 对 象 本 身 不 包含 指 癌 虚 函数 表 的 指针 ， 这 个 指针 是 存在 于 
trait object 指 针 里 面 的 ° 如 果 一 个 类 型 实现 了 多 个 trait， 那 么 不 同 的 trait 
object 指 向 的 虚 函 数 表 也 不 一 样 。 


23.2 object safe 


既然 谈 到 trait object 束 不 得 不 说 一 下 object safe 的 概念 。trait object 
的 构造 是 受到 许多 约束 的 ， 当 这 些 约束 条 件 不 能 满足 的 时 候 ， 会 产生 


编译 错误 。 
我 们 来 看 看 在 哪些 条 件 下 trait object 是 无 法 构造 出 来 的 。 
1. 当 trait 有 Self: Sized 约 束 时 


一 般 情 况 下 ， 我 们 把 trait 当 作 类 型 来 看 的 时 候 ， 它 是 不 满足 Sized 
条 件 的。 因为 trait 只 是 描述 了 公共 的 行为 ， 并 不 描述 具体 的 内 部 实 
现 ， 实 现 这 个 trait 的 具体 类 型 是 可 以 各 种 各 样 的 ， 占 据 的 空间 大 小 也 
不 是 统一 的 。Self 关 键 字 代表 的 类 型 是 实现 该 trait 的 具体 类 型 ， 在 impl 
同 的 类 型 ， 有 不 同 的 具体 化 实现 。 如 采 我 们 给 Self 加 
Sized 参 


#![feature(dyn_trait)] 

trait Foo where Self: Sized { 
fn foo(&self); 

} 


impl Foo for i32 { 
fn foo(&self) { println!("{}", self); } 
} 


fn main() { 
let x = 1 i32; 
x.foo(); 
//let p = &x as &dyn Foo; 
//p.foo(); 


我 们 可 以 看 到 ， 直 接 调 用 函数 foo 依 然 是 可 行 的 。 可 是 ， 当 我 们 试 
图 创建 trait object 的 时 候 ， 编 译 器 阻止 了 我 们 : 


error: the trait ‘Foo cannot be made into an object [E0038] 


所 以 ， 如 果 我 们 不 希望 一 个 trait 通 过 trait object 的 方式 使 用 ， 可 以 
为 它 加 上 Self: Sized 约 束 。 


同 理 ， 如 果 我 们 想 阻 止 一 个 函数 在 虚 函 数 表 中 出 现 ， 可 以 专门 为 
该 函数 加 上 Self: Sized 约 束 : 


#![feature(dyn_trait)] 
trait Foo { 

fn foo1(&self) ， 

fn foo2(&self) where Self: Sized; 
} 


impl Foo for i32 { 
fn fooi(&self) { printjn!("foo1 {}", self); } 
fn foo2(&self) { printjn!("foo2 {}", self); } 


fn main() { 
let x = 1 i32; 
x.foo2(); 
let p = &x as &dyn Foo; 
p.foo2(); 


编译 以 上 代码 ， 可 以 看 到 ， 如 果 我 们 针对 foo2 函 数 添 加 了 Self: 
Sized 约 束 ， 那 么 就 不 能 通过 trait object 来 调用 这 个 函数 了 。 


2. 当 函数 中 有 Self 类 型 作为 参数 或 者 返回 类 型 时 


Self 类 型 是 个 很 特殊 的 类 型 ， ER 是 impl 这 个 trait 的 当前 类 
型 。 比 如 说 ，Clone 这 个 trait 中 的 clone 方 法 就 返回 了 一 个 Self 类 型 . 


pub trait Clone { 

fn clone(&self) -> Self; 

fn clone_from(&mut self, source: &Self) { ... } 
} 


我 们 可 以 想象 一 下 ， 假 如 我 们 创建 了 一 个 Clone trait 的 trait 
object， 并 调用 clone 方 法 : 


let p: &dyn Clone = if from input() { &objl as &dyn Clone } else { &obj2 as &dyn 
Clone }; 
let 0 = p.clone(); 


变量 o 应 该 是 什么 类 型 ”编译 万 不 知道 


， 因 为 它 在 编译 阶段 无 法 确 
定 。p 指 向 的 具体 对 象 ， 它 的 类 型 是 什么 只 能 在 运行 


阶段 确定 ， 无 法 在 


编译 阶段 确定 。 在 编译 阶段 ， 我 们 知道 的 仅仅 是 这 个 类 型 实现 了 Clone 
trait， 其 他 的 就 一 无 所 知 了 。 而 这 个 clone () 方法 又 要 求 返回 一 个 与 p 
指 辐 的 具体 类 型 一 致 的 返回 类 型 ， 所 以 o 的 类 型 是 无 法 确定 的 。 对 编译 
锋 来 说 ， 这 是 无 法 完成 的 任务 。 所 以 ，std: : clone: : Clone 这 个 trait 
束 不 是 object safe 的 ， 我 们 不 能 利用 &dyn Clone 构 造 trait object 来 实现 虚 
函数 调用 。 


编译 下 面 的 代码 : 


#![feature(dyn_trait)] 
fn main() { 
let s = String::new(); 
let p : &dyn Clone = &s as &dyn Clone(); 


error: the trait ‘std::clone::Clone. cannot be made into an object 


Rust 规 定 ， 如 采 画 数 中 除了 self 这 个 参数 之 外 ， 还 在 其 他 参数 或 者 
返回 值 中 用 到 了 Self 类 型 ,那么 这 个 函数 束 不 十 object safe 的 。 这 样 的 
0 trait object 来 调用 的 。 这 样 的 方法 是 不 能 在 虚 函 数 表 中 
年 在 的 。 


这 样 的 规定 在 某 些 情况 下 会 给 我 们 造成 一 定 的 困扰 。 假 如 我 们 有 
下 面 这 样 一 个 trait， 它 里 面 的 一 部 分 方法 是 满足 object safe 的 ， 而 另外 
一 部 分 是 不 满足 的 : 


#![feature(dyn_trait)] 
trait Double { 

fn new() -> Self， 

fn double(&mut self); 
} 


impl Double for i32 { 

fn new() -> i32 {0} 

fn double(&mut self) { *self *= 2; } 
} 


fn main() { 
let mut i = 1; 
let p : &mut dyn Double = &mut i as &mut dyn Double; 


p.double()， 


编译 会 出 错 ， 因 为 new () 这 个 方法 是 不 满足 object safe 条 件 的 。 
但 是 我 们 其 实 只 想 在 trait ww 并 不 指望 通过 trait 
I () 方法 ， 但 可 惜 编译 器 还 是 直接 禁止 了 这 个 trait object 
的 创建 


面 对 这 样 的 情况 ， 我 们 应 该 怎么 处 理 呢 ?我 们 可 以 通过 下 面 的 写 
法 ， 把 new () 方法 从 trait object 的 虚 函 数 表 中 移 除 ; 


fn new() -> Self where Self: Sized; 


把 这 个 方法 加 上 Self Sized 约 束 ， 编 译 絮 束 不 会 在 生成 上 庶 函 数 表 
的 时 候 考 虑 它 了 。 生 成 trait object 的 时 候 ， 只 需 考 虑 double () 这 一 个 
方法 ， 编 译 怖 束 会 很 愉快 地 创建 这 样 的 虚 函 数 表 和 trait object。 通 过 这 
种 方式 ， 我 们 就 可 以 解决 掉 一 个 trait 中 一 部 分 方法 不 满足 object safe 的 
烦恼 。 

3. 当 函数 第 一 个 参数 不 是 self 时 

局 思 是 ， 方法 ”， 那 这 个 “静态 方法 ”是 不 满足 object 
safe 条 件 的 。 这 个 条 件 几 乎 是 显然 的 ， 编 译 絮 没有 办 法 把 静态 方法 加 
双 到 上 画 数 关中 。 

与 上 面 讲解 的 情况 类 似 ， 如 果 一 个 trait 中 存在 静态 方法 ， 而 又 硕 
望 通 过 trait object 来 调用 其 他 的 方法 ， 那 么 我 们 需要 在 这 个 静态 方法 后 
面 加 上 Self Sized 约 束 ， 将 它 从 虚 函 数 表 中 剔除 。 

4. 当 函数 有 沁 型 参数 时 


假如 我 们 有 下 面 这 样 的 trait: 


trait SomeTrait { 
fn generic_ fn<A>(&self, value: A); 
} 


这 个 函数 市 有 一 个 沁 型 参数 ， 如 果 我 们 使 用 trait object 调 用 这 个 画 


fn func(x: &dyn SomeTrait) { 
x.generic_fn("foo"); // A = &str 
x.generic fn(1 u8); //A= u8 
} 


这 样 的 写法 会 让 编译 絮 特 别 犯难 ， 本 来 x 是 trait object， 通 过 它 调 
用 成 员 的 方法 是 通过 vtable 虚 函数 表 来 进行 查找 并 调用 。 现 在 需要 被 查 
找 的 函数 成 了 泛 型 国 数 ， 而 泛 型 国 数 在 Rust 中 是 编译 阶段 目 动 展开 
的 ，generic_fn 函 数 实际 上 有 许多 不 同 的 版 本 。 这 里 有 一 个 根本 性 的 冲 
突 问题 。Rust 选 择 的 解决 方案 是 ， 禁 止 使 用 trait object 来 调用 泛 型 函 
数 ， 沁 型 画 数 是 从 虚 函 数 表 中 吻 除 了 的 。 这 个 行为 跟 C++ 是 一 样 的 。 
C++ 中 同样 规定 了 类 的 虚 成 员 函 数 不 可 以 是 template 方 法 。 


23.3 impl trait 
本 市 所 讲 的 impl trait 是 一 个 全 新 的 语法 。 比 如 下 这 样 : 


fn foo(n: u32) -> impl Iterator<Item=u32> { 
(0..n).map(|x| x * 100) 


下 面 我 们 来 讲解 impl Iterator<Item=u32>。 


我 们 注意 到 ， 在 写 沁 型 画 数 的 时 候 ， 参 数 传递 方式 可 以 有 : 静态 
分 派 或 动态 分 派 两 种 选择 : 


fn consume_iter_static<I: Iterator<Item=u8>>(iter: I) 
fn consume_iter_dynamic(iter: Box<dyn Iterator<Item=u8>>) 


不 论 选用 哪 种 方式 ， 都 可 以 写 出 针对 一 组 类 型 的 抽象 代码 ， 而 不 
是 针对 某 一 个 具体 类 型 的 。 在 consume iter_static 版 本 中 ， 每 次 调用 的 
时 候 ， 编 译 絮 都 会 为 不 同 的 实 参 类 型 实例 化 不 同 版 本 的 函数 。 在 
consume _iter_dynamic 版 本 中 ， 每 次 调用 的 时 候 ， 实 参 的 具体 类 型 隐藏 
J object 的 后 面 ， 通 过 虚 函 数 表 ， 在 执行 阶段 选择 调用 正确 的 函 
类 


这 两 种 方式 都 可 以 在 函数 参数 中 正常 使 用 。 但 是 ， 如 采 我 们 考虑 
函数 的 返回 值 ， 目 前 只 有 这 样 一 种 方式 征 合法 的 : 


fn produce_iter_dynamic() -> Box<dyn Iterator<Item=u8>> 
以 下 这 种 方式 是 不 合法 的 : 
fn produce_iter_static() -> Iterator<Item=u8> 


目前 版 本 中 ，Rust 只 文 持 返回 “具体 类 型 ”， 而 不 能 返回 一 个 trait 。 
由 于 缺少 了 “不 装 箱 的 抽象 返回 类 型 "这 样 一 种 机 制 ， 导 致 了 以 下 这 些 


问题 。 

-我 们 返回 一 个 复杂 的 适 代 器 的 时 候 ， 会 让 返回 类 型 过 于 复杂 ， 而 
且 油 漏 了 具体 实现 。 比 如 ， 如 采 我 们 需要 返回 一 个 栈 上 的 迭代 癸 ， 可 
能 需要 为 男 数 写 复 杂 的 返回 类 型 : 


Chain<Map<'a, (int, u8), u16, Enumerate<Filter<'a, u8, vec::MoveItems<u8>>>>, 
Skipwhile<'a, ui16, Map<'a, &u16, U16, slice::Items<u16>>>> 


男 数 内 部 的 逻辑 稍微 有 点 变 化， 这 个 返回 类 型 束 要 跟着 改变 ， 远 
不 如 泛 型 函数 参数 T，TIterator 的 抽象 程度 好 。 


图 数 无 法 直接 返回 一 个 闭 包 。 因 为 团 包 的 类 型 是 编译 右 目 动 生 成 
的 一 个 匿名 类 型 ， 我 们 没 办 法 在 函数 的 返回 类 型 中 手工 指定 ， 所 以 返 
回 一 个 财 包 一 定 要 “ 厂 箱 ”到 扒 内 存 中 ， 然 后 把 胖 指 针 返 回回 去 ， 这 样 
征 有 性 能 开销 的 。 


fn multiply(m: i32) -> Box<dyn Fn(i32)->i32> { 
Box: :new(move |x|x*m) 


} 


fn main() { 
let f = multiply(5); 
println!("{}", f(2)); 


请 注意 ， 这 种 时 候 引 入 一 个 泛 型 参数 代表 这 个 闭 包 是 行 不 通 的 : 


fn multiply<T>(m: i32) -> T where T:Fn(i32)->i32 { 
move |x|x*m 


fn main() { 
let f = multiply(5); 
println!("{}", f(2)); 
} 


编译 出 错 ， 编 译 错误 为 


note: expected type °T. 
found type ‘ [closure@test.rs:3:5: 3:16 m:_]. 


因为 泛 型 这 种 语法 实际 的 意思 是 ， 泛 型 参数 T 由 “调用 者 ?决定 。 比 
如 std: : iter: : Iterator: : collect 这 个 芳 数 惑 非常 适合 这 样 实现 : 


let a = [1, 2, 3]; 

let doubled = a.iter() 
.map(|&x| x * 2) 
.Collect::<?7??>::(); 


使 用 者 可 以 在 ? ? ? 这 个 地 方 填充 不 同 的 类 型 ， 如 Vec<i32>、 
VecDeque<i32>、LinkedList<i32> 等 。 这 个 collect 方 法 的 返回 类 型 是 一 
个 抽象 的 类 型 集合 ， 调 用 者 可 以 随意 选择 这 个 集合 中 的 任意 一 个 具体 


这 跟 我 们 上 面 想 返回 一 个 内 部 的 闭 包 情况 不 同 ， 上 面 的 程序 想 表 
达 的 是 返回 一 个 “具体 类 型 >， 这 个 类 型 是 由 被 调用 的 函数 自行 决定 
的 ， 只 是 调用 者 不 知道 它 的 名 字 而 已 。 

为 了 解决 上 面 的 问题 ，aturon 提 出 了 impl trait 这 个 方案 。 此 方案 引 
入 了 一 个 新 的 语法 ， 可 以 表达 一 个 不 用 闭 箱 的 匿名 类 型 ， 以 及 它 所 满 
足 的 基本 接口 。 


示例 如 下 : 


#![feature(conservative_ impl trait)] 


fn multiply(m: i32) -> impl Fn(i32)->i32 { 
move |x|x*m 


} 


fn main() { 
let f = multiply(5); 
println!("{}", f(2)); 


这 里 的 impl Fn (i32) ->i32 表 示 ， 这 个 返回 类 型 ， 虽 然 我 们 不 知 
道 它 的 具体 名 字 ， 但 是 知道 它 满足 Fn (size) ->isize 这 个 trait 的 约束 。 
因此 ， 它 解决 了 “返回 不 装 箱 的 抽象 类 型 > 问题 。 


它 跟 沁 型 钞 数 的 主要 区 别 是 ， 泛 型 画 数 的 类 型 参数 是 函数 的 调用 
者 指定 的 ;impl trait 的 具体 类 型 是 函数 的 实现 体 指 定 的 。 


为 什么 这 个 功能 开关 名 称 是 #1! [feature (conservative_impl] trait) ] 
呢 ? 因为 目前 为 止 ， 它 的 使 用 场景 非常 保守 ， 只 人 允许 这 个 语法 用 于 普 
通 函 数 的 返回 类 型 ， 不 能 用 于 参数 类 型 等 其 他 地 方 。 实 际 上 设计 组 已 
经 通过 了 另外 一 个 RFC， 将 这 个 功能 扩展 到 了 更 多 的 场景 ， 但 是 这 些 
功能 目前 在 编译 右 中 还 没有 实现 。 


让 impl trait 用 在 函数 参数 中 : 


fn test(f: impl Fn(i32)->i32){} 


"i 上 impl trait 用 在 类 型 别名 中 : 


type MyIter = impl Iterator<Item=i32>,; 


:让 impl trait 用 在 trait 中 的 方法 参数 或 返回 值 中 : 


trait Test 
fn test() -> impl MyTrait,; 


“让 impl Trait 用 在 trait 中 的 关联 类 型 中 : 


trait Test { 
type AT = impl MyTrait; 


在 某 些 场景 下 ，impl trait 这 个 语法 具有 明显 的 优势 ， 因 为 它 可 以 
提高 语言 的 表达 能 力 。 但 是 ， 要 把 它 推 广 到 各 个 场景 下 使 用 ， 还 需要 
大 量 的 设计 和 实现 工作 。 目 前 的 这 个 RFC 将 目标 缩小 为 了 : 先 推 进 这 
个 语法 在 函数 参数 和 返回 值 场景 下 使 用 ， 其 他 的 情况 后 面 再 考虑 。 


最 后 需要 跟 各 位 读者 提醒 一 点 的 是 ， 不 要 过 于 油 进 地 使 用 这 个 功 
能 ， 如 在 每 个 可 以 使 用 impl trait 的 地 方 都 用 它 替 换 原 来 的 具体 类 型 。 
它 更 多 地 倾向 于 们 六 性 ， 而 牺牲 了 一 部 分 表达 能 力 。 比 如 拿 前 文 那个 
复杂 的 迭代 器 类 型 来 说 ， 


fn test() -> Chain<Map<...>> 
我 们 可 能 硕 望 将 函数 返回 类 型 写成 下 面 这 样 : 
fn test() -> impl Iterator<Item=u16> 


在 绝 大 多 数 应 用 场景 下 ， 这 样 写 更 精 倍 、 更 清晰 。 但 是 ， 这 样 写 
实际 上 古 降 低 了 表达 能 力 。 因 为 ， 使 用 前 一 种 写法 ， 用 户 可 以 拿 到 这 
个 迭代 器 之 后 再 调用 clone () 方法 ， 而 使 用 后 一 种 写法 ， 就 不 可 以 
了 。 如 果 和 希望 支持 clone， 那 么 需要 像 下 面 这 样 写 


fn test() -> impl Iterator<Item=u16> + Clone 


而 这 两 个 trait 依 然 不 十 原来 那个 具体 类 型 的 所 有 对 外 接口 。 在 某 
| 需要 罗列 出 各 种 接口 才能 完整 殖 代 原来 的 写法 ， 类 似 下 面 
这 样 : 


fn test() -> impl Iterator<Item=u16> + 
Clone + 
ExactSizeIterator+ 
TrustedLen 


先 不 管 这 种 写法 是 否 可 行 ， 单 说 这 个 复杂 程度 ， 就 已 经 完全 失去 
了 impl trait 功 能 的 意义 了 。 所 以 ， 什 么 时 候 该 用 这 个 功能 ， 什 么 时 候 
不 该 用 ， 应 该 仔细 权衡 一 下 。 


ye 


24.1 合 谷 


跟 C++ 的 STL 类 似 ，Rust 的 标准 库 也 给 我 们 提供 了 一 些 比较 利用 的 
容 郁 以 及 相关 的 迭代 大 。 目 前 实现 了 的 容 郁 有 : 


容 器 描 述 
Vec 可 变 长 数组 ， 连 续 存储 
VecDeque 双向 队列 ， 适用 于 从 头 部 和 尾部 插入 删除 数据 
LinkedList 双向 链表 ， 非 连续 存储 
HashMap 基于 Hash 算法 存储 一 系列 键 值 对 
BTreeMap 基于 B 树 存 储 一 系列 键 值 对 
HashSet 基于 Hash 算法 的 集合 ， 相 当 于 没有 值 的 HashMap 
BTreeSet 其 于 B 树 的 集合 ， 相 当 于 没有 值 的 BTreeMap 
BinaryHeap 基于 二 叉 堆 实现 的 优先 级 队列 


下 面 选择 几 个 常见 的 命令 来 讲解 它们 的 用 法 及 特点 。 
24.1.1 Vec 


Vec 是 最 常用 的 一 个 容器 ， 对 应 C++ 里 面 的 Vector。 它 束 是 一 个 可 以 
目 动 扩展 容量 的 动态 数组 。 它 重 载 了 Index 运 算 符 ， 可 以 通过 中 括号 取 
下 标的 形式 访问 内 部 成 员 。 它 还 重 载 了 DerefDerefMut 运 算 符 ， 因 此 可 
以 目 动 被 解 引 用 为 数组 切片 。 


常见 用 法 示例 如 下 : 


fn main() { 


// 常见 的 几 种 构造 Vec 的 方式 

// 1，new() 方法 与 default() 方法 一 样 , 构造 一 个 空 的 Vec 

let v1 = Vec::<i32>: :new(); 

// 2， with_capacity() 方法 可 以 预先 分 配 一 个 较 大 空间 , 避免 插入 数据 的 时 候 动 态 扩容 
let v2 : Vec<String> = Vec::with _ capacity(1000); 

// 3， 利用 宏 来 初始 化 , 语法 跟 数组 初始 化 类 似 

let v3 = vec![1,2,3]; 


// 插入 数据 


let mut v4 = Vec: :new(); 


// 多 种 插入 数据 的 方式 

v4.push(1); 

v4.extend_from_ slice(&[10,20,30,40,50]); 

v4.insert(2, 100); 

printlin!("capacity: {} length: {}", v4.capacity(), v4.1len()); 


// 访问 数据 

// 调用 IndexMut 运算 符 , 可 以 写 入 数据 
v4[5] = 5; 

let i = v4[5]; 


printin!("{}", i); 
// Index 运算 符 直接 访问 , 如 果 越 界 则 会 造成 panic, 而 get 方法 不 会 , 因为 它 返回 一 个 0ption<T> 
if let Some(i) = v4.get(6) { 

printin!("{}", i); 


// Index 运算 符 支 持 使 用 各 种 Range 作为 索引 
let slice = &v4[4..]; 
printin!("{:?}", slice); 


以 上 示例 包含 了 Vec 中 最 常见 的 一 些 操 作 ， 还 有 许多 有 用 的 方法 ， 
不 方便 在 本 书 一 一 罗列 ， 各 位 读者 可 以 参考 标准 文档 。 


一 个 Vec 中 能 存储 的 元 素 个 数 最 多 为 std: : usize: : MAX 个 ， 起 
过 了 会 发 生 panic。 因 为 它 记 录 元 素 个 数 ， 用 的 就 是 usize 类 型 。 如 果 我 
们 指定 元 素 的 类 型 是 0 大 小 的 类 型 ， 那 么 ， 这 个 Vec 根 本 不 需要 在 堆 上 
分 配 任 何 空 间 。 男 外 ， 因 为 Vec 里 面 存在 一 个 指向 堆 上 的 指针 ， 它 永远 
是 非 空 的 状态 ， 编 译 絮 可 以 据 此 做 优化 ， 使 得 size_of: 
<Option<Vec<T>>> () ==size_of: : <Vec<T>> () 。 示 例如 下 : 


struct ZeroSizedf{} 


fn main() { 
let mut v = Vec::<ZeroSized>: :new(); 
printlin!("capacity:{} length:{}", v.capacity(), v.1len()); 


v.push(ZeroSized{}); 
Vv.push(ZeroSized{}); 
println!("capacity:{} length:{}", v.capacity(), v.1en()); 


// p 永远 指向 align_of: :<ZeroSized>(), 不 需要 调用 allocator 
let p = v.as_ptr(); 
printin!("ptr:{:p}", p); 


let size1 = std::mem::size of::<Vec<i32>>(); 
let size2 = std::mem::size of::<O0ption<Vec<i32>>>();， 
printin!("size of Vec:{} size of option vec:{}", Sizel1, size2); 


编译 执行 ， 可 得 结果 为 : 


capacity:18446744073709551615 length:0 
capacity:18446744073709551615 length:2 
ptr :Ox1 

size of Vec:24 size of option vec:24 


将 来 类 似 Vec 的 这 些 容 髓 ， 会 像 C++ 一作， 支持 一 个 新 的 泛 型 参 
吕 自 定义 allocator 。 eh 目前 还 没有 定 下 来 ， 因 此 就 不 深 
1 论 


24.1.2 VecDeqgue 


VecDeque 是 一 个 双 同 队列 。 在 它 的 头 部 或 者 尾部 执行 添加 或 者 删 
除 操作 ， 都 是 效率 很 高 的 。 它 的 用 法 和 Vec 非 常 相似 ， 主 要 是 多 了 
pop_front () push_front () 等 方法 。 


基本 用 法 示例 如 下 : 


use std::collections::VecDeque; 


fn main() { 
let mut queue = VecDeque: :with_capacity(64); 
// 向 尾部 按 顺序 插入 一 堆 数 据 
for i in 1..10 { 
queue.push_back(i); 


} 
// 从 头 部 按 顺 序 一 个 个 取出 来 
while let Some(1) = = queue.pop_front() { 
printin!("{}", i); 
} 


} 


24.1.3 HashMap 


HashMap<K, VV, S> 太 其 耳 hash 民 去 的 存储 一 组 键 值 对 (key- 
value-pair) 的 容器 。 其 中 ， 泛 型 参数 K 是 键 的 类 型 ，V 是 值 的 类 型 ，S 
是 哈 希 算法 的 类 型 。 5 这 个 流 弄 参数 有 一 个 默认 值 ， 平 时 我 们 使 用 的 时 
候 不 需要 手动 指定 ， 如 果 有 特殊 需要 ， 则 可 以 自 定义 哈 希 算法 。 


hash 算 法 的 关键 是 ， 将 记录 的 存储 地 址 和 key 之 间 建 立 一 个 确定 的 
对 应 关系 。 这 样 ， 当 想 查 找 某 人 条 记 杂 时 ， 我 们 根据 记录 的 key， 通 过 一 


次 函数 计算 ， 残 可 以 得 到 它 的 存储 地 址 ， 进 而 快速 判断 这 条 记录 是否 
存在 、 存 储 在 哪里 。 因 此 ，Rust 的 HashMap 要 求 ，key 要 满足 Eq+Hash 
的 约束 。Eq trait 代 表 这 个 类 型 可 以 作 相 等 比较 ， 并 且 一 定 满足 下 列 三 
个 性 质 : 

: 自 有 反 性 一 一 对 任意 a， 满 足 a==a; 

-对称 性 一 一 如 果 a==b 成 立 ， 则 b==a 成 立 ; 

传递 性 一 一 如 果 a==b 且 b==c 成 立 ， 则 a==c 成 立 。 


而 Hash trait 更 重要 ， 它 的 定义 如 下 : 


trait Hash { 
fn hash<H: Hasher>(&self, state: &mut H); 


} 


trait Hasher { 
fn finish(&self) -> u64; 
fn write(&mut self, bytes: &[u8]); 


} 


如 果 一 个 类 型 ， 实 现 了 Hash， 给 定 了 一 种 哈 希 算法 Hasher， 环 能 
计算 出 一 个 u64 类 型 的 哈 希 值 。 这 个 哈 布 值 束 是 HashMap 中 计算 存储 位 
置 的 关键 。 


一 般 来 说 ， 手 动 实现 Hash trait 的 写法 类 似 下 面 这 样 : 


struct Person { 
first_name: String, 
last_name: String, 


} 


impl Hash for Person { 
fn hash<H: Hasher>(&self, state: &mut H) { 
self.first_name.hash(state); 
self.last_name.hash(state); 
} 
: 


这 个 hash 方 法 基本 上 了 吏 是 重复 性 的 代码 ， 因 此 编 详 器 提供 了 目 动 
derive 来 带 我 们 实现 。 下 面 这 种 写法 才 是 平时 见得 最 多 的 : 


#[derive(Hash)] 

struct Person { 
first_name: String, 
last_name: String, 


一 个 完整 的 使 用 HashMap 的 示例 如 下 : 


Use std::collections::HashMap; 


#[derive(Hash, Eq, PartialEq, Debug)] 
struct Person { 

first_name: String, 

last_name: String, 


} 


impl Person { 
fn new(first: &str, last: &str) -> Self { 
Person { 
first_name: first.to_ string(), 
last_name: last.to_string(), 


} 


fn main() { 
let mut book = HashMap: :new() ， 
book.,insert(Person: :new("John"”， "Smith"), "521-8976"); 
book.insert(Person::new("Sandra", "Dee"), "521-9655" ) ， 
book.insert(Person::new("Ted", "Baker"), "418-4165"); 


let p = Person::new("John", "Smith"); 


// 查找 键 对 应 的 值 
if let Some(phone) = book.get(&p) { 
printin!("Phone number found: {}", phone); 


// 删除 
book.remove(&p); 


// 查询 是 否 存 在 
printJln!("Find key: {}", book.contains_key(&p)); 


HashMap 的 查找 、 插 入 、 删 除 操作 的 平均 时 间 复 杂 度 都 是 O 
(1) 。 在 这 个 例子 中 ，HashMap 内 部 的 存储 状态 类 似 下 图 所 示 : 


keys buckets 


John Smith 


Lisa Smith 


Sam Doe 


John Smith S521-1234 
Ted Baker 418-4165 


Sandra Dee 


Ted Baker 


除了 上 面 例子 中 演示 的 这 些 方法 外 ，HashMap 还 设计 了 一 种 叫 作 


entry 的 系列 API。 考 虑 这 样 的 一 种 场景 ， 我 们 需要 先 查 看 某 个 key 是 否 
存在 ， 然 后 再 做 插入 或 删除 操作 。 这 种 时 候 ， 如 有 果 我 们 用 传统 的 AP1L， 
那么 就 需要 执行 两 志和 查找 的 操作 : 


if map.contains_key(key) { // 执行 了 一 遍 hash 查 找 的 工作 
map.insert(key，value); // 又 执行 了 一 遍 hash 查 找 的 工作 


如 有 果 我 们 用 entry API， 则 可 以 提高 效率 ， 而 且 代 码 也 更 流畅 : 


map.entry(key).or_insert(value); 


HashMap 也 实现 了 迷 代 器 ， 使 我 们 可 以 直接 遍历 整个 容器 ， 这 部 
分 内 容 放 到 后 面色 代 器 部 分 讲解 。 


HashMap 里 面 ，key 存 储 的 位 置 跟 它 本 里 的 值 密切 相关 ， 如 果 key 本 
号 变 了 ， 那 么 它 存放 的 位 置 也 需要 相应 变化 。 所 以 ，HashMap 设 计 的 
各 种 API 中 ， 指 向 key 的 借用 一 般 是 只 读 借 用 ， 防 止 用 户 修改 它 。 但 
是 ， 只 读 借用 并 不 能 完全 保证 它 不 被 修改 ， 读 者 应 该 能 想到 ， 只 读 借 
用 依然 可 以 改变 具备 内 部 可 变性 特点 的 类 型 。 下 面 这 个 示例 演示 了 ， 

如 果 我 们 动态 修改 了 HashMap 中 的 key 值 ， 会 出 现 什 么 后 果 : 


use std::hash::{Hash, Hasher}; 
use std::collections::HashMap; 
use std::cell::Cell; 


#[derive(Eq, PartialEq)] 
struct BadKey { 
value: Cell<i32> 


imp BadKey { 
fn new(v: i32) -> Self { 
BadKey { value: Cell::new(v) } 
} 
} 


impl Hash for BadKey { 
fn hash<H: Hasher>(&self, state: &mut H) { 
self.value.get().hash(state); 
} 
} 


fn main() { 
let mut map = HashMap: :new(); 
map.insert(Badkey: :new(1), 100); 
map.insert(Badkey: :new(2), 200); 


for key in map.keys() { 
key.value.set(key.value.get() * 2); 
} 


printJln!("Find key 1:{:?}", map.get(&BadkKey: :new(1))); 
printJln!("Find key 2:{:?}", map.get(&BadkKey: :new(2))); 
printJln!("Find key 4:{:?}", map.get(&BadkKey: :new(4))); 


在 上 面 的 示例 中 ， 我 们 设计 了 一 个 具备 内 部 可 变性 的 类 型 作为 
key。 然 后 直接 在 容器 内 部 把 它 的 值 改变 ， 接 下 来 继续 做 查找 。 可 以 看 
到 ， 我 们 再 也 找 不 到 这 几 个 key 了 ， 不 论 是 用 修改 前 的 key 值 ， 还 是 用 
修改 后 的 key 值 ， 都 找 不 到 。 这 种 钳 误 属于 逻辑 销 误 ， 是 编译 器 无 法 静 
态 检查 出 来 的 。 所 有 关联 容 锅 ， 比 如 HashMap、HashSet、BTreeMap、 
BTreeSet 等 都 存在 这 样 的 情况 ， 使 用 者 需要 上 自己 避免 。 


标准 库 中 的 HashSet 类 型 融 不 再 展开 讲解 了 ， 它 跟 HashMap 非 党 类 
似 ， 主 要 区 别 在 于 它 只 有 key 没 有 value， 从 源码 定义 我 们 也 可 以 看 到 ; 


struct HashSet<T，S = RandomState> { 
map: HashMap<T, (), S>, 


24.1.4 BTIreeMap 


BTreeMap<K，V> 是 基于 B 树 数据 结构 的 存储 一 组 键 值 对 (key- 
value-pair) 的 容器 。 它 跟 HashMap 的 用 途 相似 ， 但 是 内 部 存储 的 机 制 
不 同 。B 树 的 每 个 节点 包含 多 个 连续 存储 的 元 素 ， 以 及 多 个 子 节点 。B 
树 的 结构 如 下 图 所 示 : 


回 . 回 .回回 


BTreeMap 对 key 的 要 求 是 满足 Ord 约 束 ， 即 具备 “全 序 ” 特 征 。 前 文 
中 关于 Hash-Map 的 示例 也 可 以 用 BTreeMap 重 写 ， 从 中 我 们 可 以 看 到 它 
的 基本 用 法 与 HashMap 很 相似 : 


use std::collections::BTreeMap; 


#[derive(Ord, PartialOrd, Eq, PartialEq, Debug)] 
struct Person { 

first_name: String, 

last_name: String, 


} 


impl Person { 
fn new(first: &str, last: &str) -> Self { 
Person { 
first_name: first.to_ string(), 
last_name: last.to_string(), 
} 
} 
} 


fn main() { 
let mut book = BTreeMap: :new(); 


book.insert(Person::new("John", "Smith"), "521-8976"); 
book.insert(Person: :new("Sandra", "Dee"), "521-9655" ) ， 
book.insert(Person::new("Ted", "Baker"), "418-4165"); 


let p = Person::new("John", "Smith"); 


// 查找 键 对 应 的 值 
if let Some(phone) = book.get(&p) { 
printJln!("Phone number found: {}", phone); 


// 删除 
book.remove(&p); 


// 查询 是 否 存 在 
printJln!("Find key: {}", book.contains_key(&p)); 


同样 ，BTreeMap 也 实现 了 entry API1。BTreeMap 也 实现 了 送 代 器 ， 
同样 可 以 直接 遇 历 。 但 是 HashMap 在 遇 历 的 时 候 ， 是 不 保证 遍历 结果 
顺序 的 ， 而 BTreeMap 上 自动 把 数据 排 好 序 了 ， 它 遇 历 结果 一 定 是 按 固定 


顺序 的 。 


BTreeMap 比 HashMap 多 的 一 项 功能 是 ， 它 不 仅 可 以 查询 单个 key 的 


结果 ， 还 可 以 查询 一 个 区 间 的 结果 ， 示 例如 下 : 


use std::collections::BTreeMap; 


fn main() { 
let mut map = BTreeMap: :new!(); 
map.insert(3, "a"); 
map.insert(5, "b"); 
map.insert(8, "c"); 
for (k, v) in map.range(2..6) { 
println!({} : {}", k, v); 


} 
} 
执行 结果 是 
3 : a 
5 : b 


当然 ， 我 们 还 可 以 使 用 其 他 的 Range 类 型 ， 
此 就 不 性 述 了 。 


如 RangeInclusive 等 ， 在 


对 应 的 ， 标 准 库 中 的 BTreeSet 类 型 就 不 再 展开 讲解 了 ， 它 跟 
BTreeMap 非 党 类似， 主要 区 别 在 于 它 只 有 key 没 有 value， 从 源码 定义 
我 们 也 可 以 看 到 ; 


struct BTreeSet<T> { 
map: BTreeMap<T, ()>, 
} 


2472 八代 于 


迭代 器 是 Rust 的 一 项 重要 功能 。Rust 的 迭代 器 是 指 实现 了 Iterator 
trait 的 类 型 。 这 个 Iterator trait 的 定义 如 下 : 


trait Iterator { 
type Item; 
fn next(&mut self) -> Option<Self::Item>; 


它 最 主要 的 一 个 方法 束 是 next () ， 返 回 一 个 Option<Item>。 一 般 
情况 返回 Some (Item) ; 如 果 迭 代 完 成 ， 就 返回 None 。 


24214 么 需 过 人 


接 下 来 我 们 试 一 下 如 何 实现 一 个 迭代 器 NE Ee 
个 从 代 旭 会 生成 一 个 从 1 到 100 的 序列 。 我 们 需要 创建 一 个 类 型 ， 这 
使 用 struct， 它 要 实现 Iterator trait。 注 意 到 每 次 调用 next 方 法 的 7 , 
它 都 返回 不 同 的 值 ， 所 以 它 一 定 要 有 一 个 成 员 ， 能 记录 上 次 返回 的 是 
什么 。 完 整 代码 如 下 : 


use Std: :iter::Iterator ， 


Struct Seq { 
current : i32 


} 
impl Seq { 
fn new() -> Self { 
Seq { current: 0 } 
} 


impl Iterator for Seq { 
type Item = i32,; 


fn next(&mut self) -> Option<i32> { 
If self.current < 100 { 
self,.current += 1; 
return Some(self.current); 
} else { 
return None; 


} 
} 
} 


fn main() { 
let mut seq = Seq: :new(); 
while let Some(i) = seq.next() { 
println!("{}", 1); 


编译 执行 ， 可 见 结果 和 预期 一 样 。 
24.2.2 迁 代 恕 的 组 谷 


Rust 标 准 库 有 一 个 命名 规范 ， 从 容器 创造 出 迷 代 带 一 般 有 三 种 方 
人 


-iter () 创造 一 个 Item 是 &T 类 型 的 迭代 器 
-iter_ mut () 创造 一 个 Item 是 &mut T 类 型 的 迭代 器 ; 
-into_iter () 创造 一 个 Item 是 T 类 型 的 迭代 器 。 


比如 ， 用 Vec 示 例如 下 : 


fn main() { 
let v = vec![1, 2,3,4,5]; 
let mut iter = v.iter(); 
while let Some(i) = iter.next() { 
println!("{}", 1); 


如 果 送 代 絮 就 是 这 么 简单 ， 那 么 它 的 用 处 基本 就 不 大 了 。Rust 的 
迭代 絮 有 一 个 重要 特点 ， 那 它 就 是 可 组 合 的 (composability) ° 我们 
在 前 面 演示 的 欠 代 恬 的 定义 ， 实 际 上 和 省略 了 很 大 一 部 分 内 容 ， 去 官方 
文档 去 查 一 下 ， 可 以 看 到 Iterator trait 里 面 还 有 一 大 堆 的 方法 ， 比 如 
nth、map、filter、skip_while、take 等 等 ， 这 些 方法 都 有 默认 实现 ， 它 
们 可 以 统称 为 adapters 〈 适 配器 ) 。 它 们 有 个 共性 ， 返回 的 是 一 个 具体 
类 型 ， 而 这 个 类 型 本 身 也 实现 了 Iterator trait 。 这 意味 着 ， 我 们 调用 这 
些 方 法 可 以 从 一 个 迭代 器 创造 出 一 个 新 的 迭代 器。 


我 们 用 示例 来 演示 一 下 这 些 适 配器 的 威力 : 


fn main() { 

let v = vec![1,2,3,4,5,6,7,8,9]; 

let mut iter = v.iter() 
,take(5) 
.filter(|&x| x % 2 == 0) 
.map(|&x| x * x) 
enumerate( ); 

while let Some((i, 2 = iter.next() { 
println!("{} {}", i, v); 


ET a 
的 “意图 ”， 它 表达 的 重点 是 “我 想 做 什么 ”， 而 不 是 具体 怎么 做 。 这 
跟 C# 的 linq 很 相似 。 如 果 我 们 用 传统 的 循环 来 写 这 些 逻 辑 ， 人 
类 似 下 面 这 样 : 


fn main() { 
let v = vec![1,2,3,4,5,6,7,8,9]; 
let mut iter = v.iter(); 
Jet mut count = 0; 
let mut index = 0; 
while let Some(i) = iter.next() { 
If count < 5 f{ 
count += 工 ; 
if (*i) %2 ==0f{ 
let s = (*i) * (™ i); 
println!i("{} {}", index, Ss); 
index += 1; 


} 
} else { 
break; 
} 


} 
} 


上 面 这 种 写法 ， 源 代码 更 倾 同 于 实现 细 了 。 两 个 版 本 相 比 较 ， 和 迭 
代 厂 的 可 读 性 是 不 言 而 喻 的 。 这 种 抽象 相 比 于 直接 在 传统 的 循环 内 部 
写 各 种 逻辑 是 有 优势 的 ， 特 别 是 在 后 文 “ 并 行 ? 的 章节 中 我 们 可 以 看 
到 ， 如 果 我 们 想 把 迭代 器 改 成 并 行 执 和 于 是 非常 容易 的 事情 "而 传统 的 
写法 涉及 细节 太 多 ， 不 太 容 易 改 成 并 行 执行 。〈 一 个 题 外 话 ， 
的 可 组 合 性 是 一 个 非常 大 的 优点 ， 新 版 C++ 标准 中 引入 了 ranges 这 
库 ， 主 要 就 是 为 了 解决 这 个 问题 。) 


通过 上 面 分 析 迭 代 器 的 实现 原理 我 们 也 可 以 知道 ,构造 一 个 迭代 
器 本 身 ， 是 代价 很 小 的 行为 ， 因 为 它 只 是 初始 化 了 一 个 对 象 ， 并 不 真 
正 产生 或 消费 数据 。 不 论 迭 代 器 内 部 藤 套 了 多 少 层 ， 最 终 消费 数据 还 
是 要 通过 调用 next () 方法 实现 的 。 这 个 特点 ， 也 被 称 为 惰性 求 值 
(lazy evaluation) 。 也 就 是 说 ， 如 果 用 户 写 了 下 面 这 样 的 代码 : 


let v = vec![1, 2, 3, 4, 5]; 
Vv.iter().map(|x| println!("{}", x)); 


实际 上 是 什么 事 都 没 做 。 因 为 map 方 法 只 是 把 前 面 一 个 欠 代 器 包 
装 一 下 ， 构 造 一 个 新 的 迭代 器 而 已 ， 没 有 真正 读 取 容 絮 内 部 的 数据 。 


24.2.3 for 循环 


在 前 面 的 示例 中 ， 我 们 都 是 手工 直接 调用 迭代 器 的 next () 方 
法 ， 然 后 使 用 while let 语 法 来 做 循环 。 实 际 上 ，Rust 里 面 更 人 简洁、 更 目 
然 地 使 用 迭代 句 的 方式 是 使 用 for 循 环 。 本 质 上 来 说 ，for 循 环 就 是 专 | 
为 从 代 絮 设 计 的 一 个 语法 糖 。for 循 环 可 以 对 针对 数组 切 厂 、 字 符 串 、 
Range、Vec、LinkedList、HashMap、BTreeMap 等 所 有 具有 送 代 器 的 
类 型 执行 循环 ， 而 且 还 允许 我 们 针对 自 定义 类 型 实现 人 循环 。 


use std::collections::HashMap; 


fn main() 
let v = vec![1,2,3,4,5,6,7,8,9]; 
for i inv ft 
println!("{}", 1); 


let map : HashMap<i32, char> = 

[(1, 'a'), (2, 'b'), (3, 'c')].iter().cloned().collect(); 
for (k, v) in &map { 

println!("{} : {}", k, v); 
} 


} 


那么 for 循 环 是 怎么 做 到 这 一 点 的 呢 ? 原因 束 是 下 面 这 个 trait: 


trait IntoIterator { 
type Item; 
type IntoIter: Iterator<Item=Self::Item>; 


fn into_iter(self) -> Self::IntoIter,; 
} 


只 要 某 个 类 型 实现 了 Intolterator， 那 么 调用 into iter () 方法 就 可 
以 得 到 对 应 的 迭代 器 。 这 个 into_iter () 方法 的 receiver 是 self， 而 不 是 
&self， 执 行 的 是 move 语 义 。 这 么 做 ， 可 以 同时 支持 Item 类 型 为 T、&T 
或 者 &mut T， 用 户 有 选择 的 权力 。 来 看 看 常见 的 容 絮 是 怎样 实现 这 个 
trait 的 就 明白 了 : 


impl<K, V> IntoIterator for BTreeMap<K，V> { 
type Item = (K, V); 
type IntoIter = IntoIter<K，V>， 


impl<'a, K: 'a, V: 'a> IntoIterator for &'a BTreeMap<K，V> { 
type Item = (&'a K, &'a V); 
type IntoIter = Iter<'a, K, V>; 


impl<'a, K: 'a, V: 'a> IntoIterator for &'a mut BTreeMap<K，V> { 
type Item = (&'a K, &'a mut V); 
type IntoIter = IterMut<'a, K, V>; 

} 


对 于 一 个 容器 类 型 ， 标 准 库 里 面 对 它 impl 了 三 次 IntoIterator 。 当 
Self 类 型 为 BTreeMap 的 上 时候 ，Item 类 型 为 (K，V) ， 这 意味 着 ， 每 次 
next () 方法 都 是 把 内 部 的 元 素 move 出 来 了 ; 当 Self 类 型 为 
&BTreeMap 的 时 候 ，Item 类 型 为 (&K，&V) ， 每 次 next () 方法 返 
回 的 是 借用 ; 当 Self 类 型 为 &mut BTreeMap 的 时 候 ，Item 类 型 为 
(&K，&mut V) ， 每 次 next () 方法 返回 的 key 是 只 读 的 ，value 是 可 
读 写 的 。 


所 以 ， 如 果 有 个 变量 m， 其 类 型 为 BTreeMap， 那 么 用 户 可 以 选择 
使 用 m.into iter () 或 者 (&m) .into_iter () 或 者 (&mnut 
m) .into_iter () ， 分 别 达 到 不 同 的 目的 。 


那么 for 循 环 和 IntoIterator trait 究 葛 是 什么 天 系 昵 ?下面 我 们 写 一 
个 简单 的 for 循 环 示 例 : 


fn do_something(e : &i32) {} 


fn main() { 
let array = &[1,2,3,4,5]; 


for i in array { 


do_something(i); 
} 
} 


使 用 以 下 编译 命令 : 
rustc --unpretty=hir -Z unstable-options test.rs 


可 以 看 到 输出 结果 为 : 


#[prelude_import] 

use std::prelude: :vi::*; 
#[macro_use] 

extern crate std as std,; 

fn do_something(e: &i32) { } 


fn main() { 
let array = &[1, 2, 3, 4, 5]; 


{ 
let _result = 
match ::std::iter::IntoIterator::into_iter(array) { 
mut iter => 
loop { 
Jet mut __next,; 
match ::std::iter::Iterator::next(&mut iter) { 
:Std: :option: :Option: :Some(val) => 
_ next = val, 
:Std::option: :Option: :None => break ， 
} 
let i = next' 
{ do_something(i); } 
}, 
}; 
_result 
} 


这 说 明 Rust 的 for<item>in<container>{<body>} 语 法 结构 就 是 一 个 
语法 糖 。 这 个 语法 的 原理 其 实 就 是 调用 <container>.into_iter () 方法 来 
获得 迭代 絮 ， 然 后 不 断 循环 调用 迭代 器 的 next () 方法 ， 将 返回 值 解 
包 ， 赋 值 给 <item>， 然 后 调用 <body> 语 句 块 。 


所 以 在 使 用 for 循 环 的 时 候 ， 我 们 可 以 目 主 选择 三 种 使 用 方式 : 


上 | 


的 


LE 


// container 在 循环 之 后 生命 周期 就 结束 了 , 循环 过 程 中 的 每 个 jtem 是 从 container 中 move 
for item in container {} 


二 


// 和 迭代 器 中 只 包含 container 的 & 型 引用 ,循环 过 程 中 的 每 个 item 都 是 container 中 元 素 的 借用 
for item in &container {} 
// 迭代 器 中 包含 container 的 &mut 型 引用 ,循环 过 程 中 的 每 个 item 都 是 指向 container 中 元 素 的 可 变 借 
for Item in &mut container {} 


Rust 的 IntoIterator trait 实 际 上 束 是 for 语 法 的 扩展 接口 。 如 果 我 们 需 
要 让 各 种 自 定 义 容器 也 能 在 for 循 环 中 使 用 ， 那 就 可 以 借鉴 标准 库 中 的 
写法 ， 目 行 实现 这 个 trait 即 可 。 这 跟 其 他 语言 的 设计 思路 是 一 样 的 。 
比如 : C# 的 foreach 语 句 也 可 以 对 目 定 义 类 型 使 用 ， 它 的 扩展 接口 天 是 
标准 库 中 定义 的 IEnumerable 接 口 ， Java 的 for 循 环 的 扩展 接口 是 标准 库 
中 的 Iterable 接 口 ， C++ 的 Range-based-for 循 环 也 可 以 使 用 目 定 义 容器 ， 
它 约定 的 是 调用 容器 的 begin () /end () 成 员 方法 。 


第 25 章 ”生成 器 


在 Rust 里 面 ， 协 程 (Coroutine) 是 编写 高 性 能 异步 程序 的 关键 设 
施 ， 生 成 器 (Generator) 是 协 程 的 基础 。 本 下 主 要 讲解 什么 是 生成 
右 ， 并 和 帘 要 介绍 一 下 协 程 。 


25.1 简介 


生成 侨 的 语法 很 像 前 面 讲 过 的 团 包 ， 但 它 与 闭 包 有 一 个 区 别 ， 即 
yield 关 键 子 。 当 闭 包 中 有 yield 关 键 子 的 时 候 ， 它 束 不 古 一 个 闭 包 ， 而 
是 一 个 生成 器 。 


依然 用 示例 来 说 话 。 假 设 我 们 要 生成 一 个 Fibonacci 数 列 ， 用 生成 
右 可 以 这 样 写 : 


// 方案 一 
#![feature(generators, generator_trait)] 


use std::ops::{Generator, GeneratorState}; 


fn main() { 
let mut g= || { 
Jet mut curr : u64 = 1; 
let mut next : u64 = 1; 
loop { 
let new next = curr.checked add(next); 


if let Some(new _ next) = new next { 
curr = next; 
next = new_next; 
yield curr; // <-- 新 的 关键 字 

} else { 


return， 
} 
}; 
loop { 
unsafe { 
match g.resume() { 
GeneratorState: :Yielded(v) => println!("{}", Vv), 
GeneratorState::Complete(_) => return, 
} 
} 
} 


} 


在 这 上 段 代 码 中 ， 构 造 了 一 个 生成 侨 ， 它 长 得 跟 闭 包 的 样子 差 不 
多 ， 区 别 只 是 它 内 部 用 到 了 yield 天 键 字 。 它 与 closure 类 似 的 地 方 在 
于 ， 编 译 絮 同样 会 为 它 生 成 一 个 匿名 结构 体 ， 并 实现 一 些 trait， 添 加 
一 些 成 员 方 法 。 跟 closure 不 同 的 地 方 在 于 ， 它 的 成 员 变 量 不 一 样 ， 它 
实现 的 trait 也 不 一 样 。 在 后 面 调 用 它 时 ， 不 是 采用 类 似 闭 包 的 那 种 调 


用 方式 ， 而 是 使 用 编译 器 自动 生成 的 成 员 方 法 resume () 。resume 
JU 返回 结果 有 两 种 可 能 性 ， 一 种 是 Yielded 表 示 生 成 器 内 部 yield 关 键 
字 返 回 出 来 的 东西 ， 此 时 还 可 以 继续 调用 resume， 还 有 数据 可 以 继续 
生成 出 来 ; 另 一 种 是 Complete 状 态 ， 表 示 这 个 生成 右 已 经 调用 完了 ， 
它 的 值 是 内 部 return 天 键 字 返回 出 来 的 内 容 ， 返 回 了 Complete 之 后 了 加 不 
能 再 继续 调用 resume 了 ， 人 否则 会 触发 panic。 

生成 器 最 大 的 特点 承 是 ， 程 序 的 执行 流程 可 以 在 生成 右 和 调用 者 
之 间 来 回 切换 。 当 我 们 需要 暂时 从 生成 絮 中 返回 的 时 候 ， 玖 使 用 yield 
关键 字 ; 当 调 用 者 希望 再 次 进入 生成 器 的 时 候 ， 就 调用 resume () 方 
法 ， 这 时 程序 执行 的 流程 是 从 上 次 yield 返 回 的 那个 点 继续 执行 。 

上 述 程 序 的 执行 流程 很 有 意思 ， 它 是 这 样 的 : 


let g=||{...yield...}; 这 人 句 话 是 初始 化 了 一 个 局 部 变量 ， 它 是 一 个 生 
成 融 ， 此 时 并 不 执行 生成 费 内 部 的 代码 ; 

调用 g.resume () 方法 ， 此 时 会 调用 生成 器 内 部 的 代码 ; 

.执行 到 yieldcurr; 这 条 语 时 ，curr 变 量 的 值 为 1， 生 成 辟 的 方法 此 
时 会 退出 ，g.resume () 方法 的 返回 值 是 GeneratorState: : Yielded 
(1) ， 在 main 函 数 中 ， 程 序 会 打印 出 1; 


-循环 调用 g.resume () 方法 ， 此 时 再 次 进入 到 生成 器 内 部 的 代码 


:此 时 生成 妮 会 直接 从 上 次 退出 的 那个 地 方 继续 执行 ， 跳 转 到 ]oop 
循环 的 开头 ， 计 算 curr next new_next 这 几 个 变量 新 的 值 ， 然 后 再 到 


yield curr; 这 条 语句 返回 ; 

:如 此 循环 往复 ， 一 直到 加 法 计算 淤 出 ， 生 成 器 调用 了 retum; 语 
句 ， 此 时 main 函 数 那 边 会 匹配 上 GeneratorState: : Complete 这 个 分 
支 ， 程序 返回 ， 执 行 完 毕 。 


25.2 ”对 比 述 代 右 


生成 器 本 质 上 跟 和 迭代 恬 是 很 像 的 。 在 Rust 中 ， 和 迭代 恬 指 的 是 实现 
了 std: : iter: : Iterator trait 的 类 型 : 


pub trait Iterator { 
type Item; 


fn next(&mut self) -> Option<Self::Item>; 


这 个 trait 最 主要 的 一 个 方法 束 古 next 方 法 。 每 次 调用 ， 它 都 会 返回 
下 一 个 元 素 ， 迭 代 完 成 ， 束 返回 None。 使 用 方法 如 下 : 
// 假设 it 是 一 个 迭代 器 变量 


while let Some(item) = it.next() { 
do_something(item); 


next 方 法 接受 的 参数 是 &mut Self 类 型 。 因 为 它 每 次 调用 的 时 候 ， 
都 要 修改 内 部 的 状态 ， 只 有 这 样 ， 下 一 次 调用 的 时 候 才 会 返回 不 同 的 
内 容 。 如 林内 部 是 指针 ， 需 要 把 指针 指 癌 容 需 的 下 一 个 元 素 ， 如 有 果 内 
部 是 索引 ， 束 需要 更 新 索引 的 值 。 


迭 代 絮 也 可 以 不 指 癌 任何 容器 ， 只 要 它 满 足 Iterator trait 文 个 接口 
印 可 。 比 如 std: : ops: : Range 这 个 类 型 ， 它 代 表 一 个 前 闭 后 开 的 区 
间 ， 也 可 以 进行 迭代 ， 只 是 每 次 调用 next 后 它 代表 的 区 间 就 变 了 。 


任何 一 个 生成 器 ， 总 能 找到 某 种 办 法 改写 为 功能 相同 的 迭代 器 。 
水 是 凡 前 面 的 Fibponaccj 数 列 为 例 ， 如 果 改 成 迁 代 器 的 笠 于 ， 该 像 下 而 
这 样 写 : 


// 方案 二 

Struct Fibonacci 区 
curr: u64, 
next: u64, 


} 


impl Iterator for Fibonacci { 
type Item = u64; 


fn next(&mut self) -> Option<u64> { 
// 判断 是 否 会 洲 出 
let new_next = self.curr.checked add(self.next); 


if let Some(new_ next) = new next { 
// 先 更 新 内 部 状态 , 再 返 臣 
self.curr = self.next; 
self.next = new_next,; 
Some(self.curr) 

} else { 
// 加 法 溢出 ,停止 闪 代 
None 


} 
} 
} 


fn fibonacci() -> Fibonacci { 
Fibonacci { curr: 1, next: 1 } 
} 


fn main() { 
let mut it = fibonacci(); 


while let Some(i) = it.next() { 
println!("{}", i); 
} 


} 


这 段 代码 同样 也 能 实现 打印 Fibonacci 数 列 的 功能 。 请 读者 逐 行 未 
字 读 一 下 next 方 法 的 逻辑 ， 看 清楚 它 是 如 何 记 了 如 状 态 的 ， 理 解 为 什么 
i ° 这 个 示例 在 后 文 还 会 继续 使 


迭代 需 模 式 是 一 种 典型 的 “ 搁 "模式 ， 它 也 经 常 被 称 为 “惰性 求 
值 ” (lazy evaluation) 。 生 成 器 在 这 一 点 上 与 从 代 器 是 一 样 的 ， 也 需 
使 用 者 调用 方法 把 数据 拉 出 来 。 它 们 一 个 用 的 是 next 方 法 ， 一 个 用 的 
是 resume 方 法 ， 虽 然 方 法 的 签名 有 所 不 同 ， 但 使 用 上 差不多 。 


25.3 对比 立 即 求 值 


实际 上 ， 从 代码 组 织 逻 辑 上 来 说 ， 述 代 右 模式 已 经 是 相对 高 阶 一 
点 的 写法 。 对 于 一 个 刚刚 接触 编程 的 初学 者 来 说 ， 用 下 面 这 种 写法 才 
征 和 最 各 见 的 : 


// 方案 三 

fn collector() -> Vec<u64> { 
let mut res = vec![]; 
let mut curr : u64 = 1; 
lJet mut next : U64 = 1; 


loop { 
let new_ next = curr.checked add(next); 


if let Some(new next) = new next { 
curr = next; 
next = new_next; 
res.push(curr); 


return res; 


fn main() { 
let collected = collector(); 
let mut it = collected,.iter(); 
while let Some(i) = it.next() { 
println!("{}", 1); 


在 这 个 方案 中 ， 我 们 用 一 个 循环 把 Fibonacci 数 列 提前 生成 出 来 
了 了， 存储 在 一 个 动态 数组 里 ， 然 后 再 去 使 用 。 这 种 做 法 可 以 看 作 是 惰 
性 求 值 的 反 回 操作 ， 叫 作 * 立 即 求 值 ”(\eager evaluation) 。 不 过 ， 它 有 
性 能 上 的 缺点 ， 方 案 三 提前 把 数据 收集 起 来 ， 缺 少 了 灵活 性 。 如 果 使 
用 者 只 需要 使 用 这 个 序列 的 前 10 个 数据 呢 ? 如 果 是 方案 二 欠 代 器 的 那 
种 写法 ， 使 用 考 可 以 选择 裔 历 10 个 元 素 后 就 提前 break; 后 面 的 数据 既 
不 需要 生产 ， 也 不 需要 消费 ， 还 节省 了 一 个 临时 的 占用 很 大 内 存 空间 
的 容 妖 ， 这 了 驶 是 “惰性 求 值 ?的 好 处 。 如 果 我 们 把 方案 三 改 成 方案 二 迭 
代 器 的 写法 ， 性 能 和 灵活 性 更 佳 ， 但 是 需要 人 工 推 理 ， 哪些 数据 是 需 
要 存储 在 和 迭 代 恬 成 员 中 的 ， 哪 些 是 不 需要 的 ， 进 入 next 方 法 时 如 何 读 


取 上 一 次 的 状态 ， 退 出 next 方 法 时 如 何 保存 这 一 次 的 状态 等 。 这 些 都 
征 "心智 负担 ”。 业 务 逻 辑 越 复杂 ， 这 个 负担 越 广 重 。 


25.4 生成 硕 的 原理 
25.4.1 生成 需 原 理 人 简介 


再 回 过 头 来 看 一 下 生成 器 。 它 实际 上 是 迭代 器 和 立即 求 值 的 “ 杂 
交 ”。 一 方面 ， 它 写 起 来 更 接近 人 的 思维 模型 ， 代 码 流程 清晰 ， 逻 辑 上 
更 符合 直觉 ， 另 一 方面 ， 它 在 执行 的 时 候 又 具备 惰性 求 值 的 性 能 优 
劳 “那么 六 译 器 是 如 何 实 现 生成 器 的 呢 ? yield 关 键 字 在 表 后 完 疯 做 了 

人 人! 


一 句 话 总 结 ， 束 是 编译 丹 把 生成 右上 自动 转换 成 了 一 个 匿名 类 型 ， 
然后 对 这 个 类 型 实现 了 Generator 这 个 trait。 这 种 处 理 手法 和 闭 包 非常 
相似 。 和 闭 包 一 样 ， 生 成 妖 也 可 以 捕获 当前 环境 中 的 局 部 变量 ， 并 且 
可 以 用 move 做 修饰 ， 捕 获 的 环境 变量 都 是 当前 生成 咽 的 成 员 ， 捕 获 规 
则 也 与 闭 包 一 样 。Generator trait 是 这 么 定义 的 : 


trait Generator { 
type Yield,; 
type Return; 
// 至 少 到 目前 为 止 , resume 方 法 还 不 能 接受 额外 参数 , 这 个 限制 条 件 以 后 可 能 会 放宽 
// 目前 的 resume 方 法 还 是 不 稳定 版 本 , 以 后 应 该 会 去 掉 unsafe, self 的 类 型 也 会 有 所 变化 ， 
// 有 具体 参见 下 一 节 的 自 引用 类 型 
unsafe fn resume(&mut self) -> GeneratorState<Self::Yield, Self::Return>; 


但 是 ， 生 成 器 内 部 还 有 额外 的 成 员 ， 那 就 是 跨 yield 语 句 存 在 的 局 
部 变量 ， 也 都 会 当成 成 员 变 量 。 这 是 因为 ， 生 成 器 内 部 的 语句 会 成 为 
成 员 函 数 resume () 的 方法 体 ， 源 代码 中 的 yield 语 句 都 被 蔡 换 成 了 普 
通 的 return 语 句 ， 且 返回 的 是 Generator-State: : Yielded ( ) 。 源 代码 
中 的 return 语 名 依然 是 return 语 句 ， 但 返回 的 是 GeneratorState: : 
Complete (_) 。 注 意 生成 器 有 一 个 特点 ， 就 是 每 次 yield 退 出 之 后 ， 当 
前 的 局 部 变量 会 保持 当前 的 值 不 变 ， 下 一 次 被 调用 resume 再 进来 执行 
的 时 候 ， 会 继续 从 上 次 yield 的 那个 地 方 继续 执行 ， 局 部 变量 是 无 须 再 
次 初始 化 的 。 这 就 意味 着 ， 对 于 在 yield 前 和 yield 后 都 出 现 过 的 局 部 变 
量 ， 务 必要 保存 它 的 状态 ， 它 的 值 要 存 到 匿名 类 型 的 成 员 中 。 


我 们 再 看 看 最 开始 那 段 示例 ; 


let mut g= || { 
Jet mut curr : U64 
Jet mut next : U64 
loop { 


1; 
1; 


let new_next = curr.checked_add(next); // 下 轮 循环 的 时 候 要 继续 使 用 curr next 
的 值 
if let Some(new_ next) = new next { 
curr = next; 
next = new_next; 
yield curr; // <-- 此 处 退出 
} else { 
return; 
} 
}; 


可 以 看 到 ， 再 进入 生成 絮 的 时 候 ， 局 部 变量 curr next 的 值 是 马上 
就 需要 使 用 的 ， 因 此 变量 g 里 面 无 论 如 何 都 要 给 这 两 个 变量 留 下 位 置 ， 
保存 它们 的 值 。 否 则 ， 次 再 调用 resume 方 法 的 时 候 它们 束 无 法 恢 
复 到 上 次 退出 时 的 状态 了 。 而 另外 一 个 局 部 变量 new_next 则 无 须 保 
存 ， 因 为 已 没有 路 yield 仓 在， 所 以 这 个 局 部 变量 可 以 作为 成 员 方法 
resume 内 部 的 局 部 变量 ， 无 须 提升 为 g 的 局 部 变量 。 


编译 万 把 这 个 生成 璐 处 理 之 后 ， 有 还 辑 如 下 : 


// 编译 器 实际 上 不 是 在 源码 级 别 做 的 转换 , 而 是 在 MIR 做 的 转换 , 以 下 代码 只 是 为 了 说 明 原 理 ， 
// 与 真实 的 编译 器 转换 后 的 代码 并 不 一 致 
// 编译 器 是 如 何 做 这 个 转换 的 , 请 参考 源码 1librustc_mir/transform/generator.rs 
// 目前 编译 器 实际 上 是 转换 为 struct, 此 处 使 用 enum 是 为 了 更 方便 地 演示 大 概 的 逻辑 
#![feature(generators, generator_trait)] 


Use std::ops::{Generator, GeneratorState}; 


fn main() { 
let mut g={ 
enum _ AnonymousGenerator { 
Start{curr : u64, next : u64}, 
Yieldi{curr : u64, next : u64}, 
Done, 


} 


impl] Generator for _ AnonymousGenerator { 
type Yield = u64; 
type Return = (); 


unsafe fn resume(&mut self) -> GeneratorState<Self::Yield, 
Self::Return> 


use std::mem,; 
match mem: :replace(self, _ AnonymousGenerator::Done) { 
_ AnonymousGenerator::Start{curr, next} 


| _ AnonymousGenerator::Yieldi{curr, next} => { 
Jet new _ next = curr.checked add(next); 


if let Some(new next) = new next { 
*self = _ AnonymousGenerator::Yieldi{curr: next, 
next: new_ next}; 
return GeneratorState: ;Yielded(curr); 


} else { 
*self = __ AnonymousGenerator::Done; 
return GeneratorState: :Complete(()); 
} 


} 


_ AnonymousGenerator::Done => { 
panic!("generator resumed after completion") 


} 
} 
} 
} 
__ AnonymousGenerator::Start{ curr: 1, next: 1} 
}; 
loop { 
unsafe 区 
match g.resume() { 
GeneratorState: :Yielded(v) => printin!("{}", Vv), 
GeneratorState::Complete(_) => return, 
} 
} 
} 


} 


可 以 看 到 ， 转 换 后 的 代码 实际 上 适 代 器 非常 相似 。 所 以 ， 生 成 
如 实 际 上 是 让 编译 右 帮 我 们 目 动 管理 状态 ， 哪些 状态 应 该 放 到 成 员 变 
量 里 面 ， 哪 些 不 需要 ; 退出 前 如 何 保存 状态 ， 重 新 进入 的 时 候 如 何 读 
取 上 次 的 状态 等 ， 都 旦 编译 做 大 我 们 目 动 做 好 了 的 。 


如 有 果 生 成 妖 内 部 存在 多 个 yield 语 句 呢 ?比如 下 面 这 样 : 


let mut g= || { 
yield 1_ 132， 
yield 2_i32; 
yield 3_i32,; 
return 4_i32,; 


}; 


那 我 们 整 再 引入 一 个 状态 ， 来 表达 上 次 已 经 执行 到 哪 条 语句 了 ， 
下 次 调用 应 该 从 哪 条 语句 开始 执行 。 在 进入 resume 方 法 的 时 候 ， 先 判 
断 这 个 状态 ， 然 后 再 跳 转 即 可 。 


Jet mut g = { 
struct _ AnonymousGenerator { 
state: u32 


} 


impl] Generator for _ AnonymousGenerator { 
type Yield = i32; 
type Return = i32,; 


unsafe fn resume(&mut self) -> GeneratorState<Self::Yield, Self::Return> 


match self.state 
0 => { // 从 初始 状态 开始 执行 
Self,state = 1; 
return GeneratorState: :Yielded(1); 


1 => { // 上 一 次 返回 的 是 yield 1 
self,.state = 2; 
return GeneratorState: :Yielded(2); 


Dh 


=> { // 上 一 次 返回 的 是 yield 2 
self.state = 3; 
return GeneratorState: :Yielded(3); 


C 


=> { // 上 一 次 返回 的 是 yield 3 
self,.state = 4; 
return GeneratorState: :Complete(4); 


=> { // 上 一 次 返回 的 是 return 4 
panic!("generator resumed after completion") 


_ AnonymousGenerator{ state: 0} 


总 之 ， 任 何 一 个 生成 恬 ， 总 能 找到 办 法 将 它 目 动 转换 为 类 似 欠 代 
性 的 样子 。 之 所 以 说 是 类 似 ， 是 因为 生成 颖 的 功能 更 强大 ， 它 的 
resume () 方法 实际 上 可 以 设计 为 携 市 更 多 的 参 数 ， 只 是 目前 的 Rust 

还 没有 实现 ， 这 个 需求 并 不 是 很 紧急 而 已 。 


25.4.2 ” 目 引 用 类 型 


目前 的 生成 絮 只 是 一 个 在 nightly 版 本 中 存在 的 、 实 验 性 质 的 功 
能 ， 它 还 有 一 些 问题 没有 解决 。 最 主要 的 一 个 问题 是 如 何 使 得 借用 跨 


yield 存 在 。 示 例如 下 : 


#![feature(generators, generator_trait)] 


fn main() { 
let -g = || 苹 
let local = 1; 
let ptr = &local; 
yield local; 
yield *ptr,; 
}; 
} 


编译 ， 出 现 编译 错误 : 


error[E0626]: borrow may still be in use when generator yields 


这 个 错误 究竟 是 什么 意思 呢 ? 我们 可 以 通过 分 析 生 成 颖 的 原理 来 
理解 这 个 错误 的 含义 。 可 以 尝试 看 看 这 个 生成 絮 剥 挥 语法 糖 之 后 的 样 
子 。 注 意 到 ， 第 一 个 yield 之 后 变量 ptr 依 然 被 使 用 ， 且 local 这 个 变量 也 
还 存在 ， 那 么 意味 着 我 们 要 在 生成 的 匿名 类 型 的 成 员 中 ， 保 存 ptr 和 
local 这 两 个 变量 。 再 加 上 一 个 成 员 变 量 记 录 yield 的 位 置信 息 ， 我 们 可 
以 设计 下 面 这 样 的 匿名 结构 体 : 


struct _ Generator_ _{ 
local: i32, 
ptr: &i32, 
state: u32, 

} 


针对 这 个 类 型 实现 Generator 这 个 trait， 基 本 上 束 等 同 于 上 面 那 段 
程序 判 掉 语法 糖 之 后 的 效果 。 


现在 就 可 以 更 清楚 地 看 到 具体 问题 在 哪里 了 。 这 里 的 关键 点 是 : 
一 个 结构 体 类 型 内 部 出 现 了 一 个 成 员 引用 另外 一 个 成 员 的 现象 。 这 种 
类 型 被 称 为 “ 自 引 用 类 型 ” (Self-Referential Type) 。 目 前 的 Rust， 对 自 
引用 类 型 有 很 多 限制 。 因 为 这 个 类 型 会 破坏 Rust 的 一 个 基本 假设 : 任 
何 类 型 都 是 可 移动 的 。 这 个 假设 让 Rust 的 移动 语义 变 得 非常 清晰 简单 
(主要 跟 C++ 对 比 ) 。 但 是 自 引 用 类 型 在 移动 的 时 候 会 出 问题 。 原 本 
成 员 ptr 是 指向 成 员 变 量 local 的 ， 如 果 这 个 结构 体 整 体 发 生 了 移动 ，ptr 


站 针 的 值 伯 持 不 变 ，local 的 位 置 却 发 生 了 变化 ， 那 么 就 会 制造 出 感 空 
指针 。 所 以 ， 目 前 的 Rust 是 不 允许 这 种 情况 出 现 的 ， 这 种 代码 会 被 生 
Lh ° 这 就 是 上 面 那 段 示例 代码 无 法 编译 通过 的 深层 原 
o 


但 是 目 引 用 现象 未 必 台 一 定 不 安全 。 假 如 构成 目 引 用 之 后 这 个 对 
象 束 永 远 不 再 移动 ， 那 么 它 其 实 是 没 问题 的 ， 也 不 会 有 苞 空 指针 之 类 
的 情况 出 现 。 在 写生 成 厚 的 时 候 会 很 容易 出 现 目 引用 对 象 ， 如 采 完 全 
禁止 这 种 行为 ， 会 非常 影响 用 户 体 验 。 如 何 让 用 户 有 权 创 建 目 引用 的 
生成 右 ， 同 时 又 能 避免 安全 性 问题 呢 ? Rust 设 计 组 通过 巧妙 的 设计 做 
到 村 广 下 


-应 该 允许 用 户 创建 目 引 用 生成 套 ， 因 为 在 调用 resume 方 法 之 前 的 
徐 术 部 征 没 问题 的 ， 毕 葛 这 个 时 候 它 内 部 的 许多 成 员 都 是 未 初始 化 状 


一 旦 resume 被 调用 过 了 ， 以 后 就 不 能 再 移动 这 个 对 象 了 ， 因 为 这 
时 候 指 针 和 被 指向 的 对 象 很 可 能 已 经 初始 化 好 了 ， 再 发 生 移动 就 会 千 
成 内 存 不 安全 。 


具体 来 说 ， 设 计 组 会 做 以 下 改变 。 


-标准 库 引 入 一 个 新 的 智能 指针 类 型 PinMut<"a，T>， 它 可 以 指 同 
一 个 T 类 型 的 对 象 。 它 的 作用 是 ， 当 这 个 指针 存在 的 时 候 ， 它 所 指 回 
的 对 象 是 不 可 移动 的 。 


.允许 更 多 的 智能 指针 类 型 作为 self 变 量 的 类 型 ， 这 样 我 们 可 以 指 
定 resume 方 法 的 第 一 个 参数 是 self PinMut<Self> 类 型 ， 而 不 是 &mut 
self 了。 


这 样 ， 束 可 以 从 逻辑 上 保证 用 户 调 用 resume 方 法 之 前 ， 一 定 先 构 
造 出 一 个 PinMut<XXGenerator> 的 指针 变量 。 这 样 ， 在 这 个 变量 存在 
的 期 间 ， 生 成 器 就 无 法 移动 ， 调 用 resume 必 须 通 过 这 个 指针 来 完成 。 
有 了 这 个 保证 ，resume 方 法 前 面 的 unsafe 修 饰 也 就 可 以 去 掉 了 。 预 计 这 
个 设计 a 到 2018 年 下 半年 就 可 以 稳定 下 来 。 


另外 ， 生 成 器 本 身 并 不 是 直接 面向 广大 用 户 的 接口 。 用 户 真正 需 
要 的 是 完成 异步 任务 。 实 际 上 ,“ 协 程 " 才 是 最 终 用 户 用 得 最 多 的 东 


西 。 生 成 右 只 是 实现 协 程 的 一 个 底层 工具 。 最 终 ， 协 程 库 会 把 所 有 这 
些 PinMut 指 针 之 类 的 事情 封装 管 理 起 来 。 


25.5“” 协 程 测 介 


Rust 设 计 这 个 生成 右 ， 主 要 目的 在 于 ， 基 于 生成 恬 设 计 一 套 协 程 
(Coroutine) 的 方案 ， 从 而 方便 编写 大 规模 高 性 能 异步 程序 。 这 个 功 
能 也 是 Rust 设 计 组 2018 年 要 解决 的 主要 问题 之 一 ， 预 计 要 到 2018 年 年 
底 才 能 正式 稳定 下 来 。 到 上 日 前 为 止 ， 依 然 只 是 一 个 实验 性 质 的 不 稳 害 


功能 。 


所 谓 协 程 ， 指 的 是 一 种 用 户 态 的 非 抢 占 式 的 多 任务 机 制 。 它 也 可 
以 实现 多 任务 并 行 。 跟 线程 相 比 ， 它 的 最 大 特点 是 它 不 是 被 内 核 调 度 
的 ， 而 是 由 任务 自己 进行 协作 式 的 调度 。 协 程 的 实现 方案 一 般 可 以 分 
为 stackful 以 及 stackless 两 种 。Rust 的 协 程 采 用 的 是 stackless coroutine 的 
设计 思路 


在 Rust 语 言 和 标准 库 中 ， 只 引入 了 极 少 数 的 关键 字 、trait 和 类 型 。 
async 和 await 关 键 字 是 目前 许多 语言 都 采用 的 主流 方案 ， 使 用 关键 字 而 
不 是 用 宏 来 做 API， 有 助 于 社区 的 统一 性 ， 避 人 免 不 同 的 异步 方案 使 用 
完全 不 一 样 的 用 户 API。3 引 入 关键 字 使 用 的 是 edition 方 案 ， 所 以 不 会 造 
成 代码 不 兼容 问题 。 标 准 库 中 只 有 极 少 数 必须 的 类 型 ， 这 也 是 Rust 一 
贯 的 设计 思路 。 但 凡是 可 以 在 第 三 方 库 中 实现 的 ， 一律 在 第 三 方 库 中 
实现 ， 哪 怕 这 个 库 本 来 就 是 官方 核心 组 维护 的 ， 这 样 做 可 以 让 这 个 库 
的 版 本 升级 更 灵活 ， 有 助 于 标准 库 的 稳定 性 。 


Rust 的 协 程 设计 ， 核 心 是 async 和 await 两 个 关键 字 ， 以 及 Future 这 
trait: 


个 


pub trait Future { 
type Output; 
fn poll(self: PinMut<Self>, cx: &mut Context) -> Poll<Self::Output>,; 


Future 这 个 trait 代 表 的 是 异步 执行 。 它 里 面 最 重要 的 一 个 方法 古 
poll， 和 意思 征 ， 碍 看 当前 Future 的 状态 ， 这 个 方法 的 返回 类 型 如 下 : 


pub enum Poll<T> { 
Ready(T)， 


Pending, 


| 对 于 一 个 实现 了 Future Trait 的 类 型 ， 每 次 调用 这 个 poll 方 法 ， 其 实 
忠 是 查看 一 下 这 个 对 象 当 前 的 状态 是 什么 ， 该 状态 可 以 为 正在 执行 或 
者 已 经 执行 完毕 。 


Future 可 以 组 合 ， 一 个 Future 可 以 由 其 他 的 一 个 或 者 多 个 Future 包 
效 而 成 。 跟 我 们 已 经 见 过 的 迭代 絮 Iterator 很 像 > 比如 ， 我 们 可 以 实现 
一 个 新 的 Future， 它 的 结果 是 多 个 Future 按 顺序 执行 得 到 的 。 或 者 ， 实 
现 一 个 Future， 它 的 结果 是 两 个 子 Future 中 先 返 回 的 那个 。Future 组 合 
的 方式 可 以 非常 灵活 。 


然后 我 们 还 需要 一 个 调度 器 Executor， 标 准 认 中 有 一 个 Executor 的 
trait。 它 的 具体 实现 可 以 由 第 三 方 库 来 实现 。 它 应 该 有 一 个 主事 件 循 
环 ， 不 断 调用 最 外 层 每 个 收 到 了 事件 通知 的 Future 的 poll 方 法 ， 外 层 的 
Future 的 poll 方 法 被 调用 时 ， 它 了 驶 会 调用 内 层 Future 的 pol 方 法 ， 不 断 蔡 
套 。 如 果 这 个 Future 处 于 Pending 状 态 ， 那 么 这 个 Future 束 应 该 设置 好 目 
己 需 要 监听 的 事件 信息 ， 然 后 马上 返回 ， 放 弃 占 用 CPU。 等 到 合适 的 
事件 发 生 时 ， 调 度 器 则 应 该 再 次 调用 这 个 Future 的 poll 方 法 ， 驱 动 这 个 
Future 从 上 次 退出 的 那里 继续 往 下 执行 。 


大 家 可 以 看 到 ，Future 跟 Generator 一 样 ， 具 备 同 样 的 特性 ， 也 残 
是 说 可 以 在 某 个 地 方 主动 中 断 执行 ， 待 下 一 次 再 进来 的 上 时候， 刚好 可 
以 从 上 次 退出 的 地 方 恢复 执行 。 这 就 是 为 什么 Rust 的 Future 最 终 是 基于 
Generator 实 现 的 。 在 Rust 里 面 ，Generator 和 是 Future 的 基础 设施 。 


关于 这 个 Future trait， 另 外 一 个 需要 注意 的 点 是 ， 它 的 self 参 数 是 
PinMut<Sel 们 类型， 而 Generator 的 resume 方 法 的 self 参 数 是 &mnut Self 类 
型 。 这 个 PinMut 类 型 ， 也 是 一 个 智能 指针 ， 它 的 目的 主要 就 是 保证 它 
所 指 回 的 对 象 无 法 被 move。 而 &mnut Self 类 型 是 无 法 保证 这 一 点 的 。 举 
个 例子 ， 大 家 还 记得 std: : mem: : swap 方 法 吗 ? 


pub fn swap<T>(x: &mut T, y: &mut T) 


对 于 任意 两 个 T 类 型 的 对 象 ， 如 琳 我 们 拥有 指 疝 它们 的 &mut T 型 
指针 ， 束 可 以 把 它们 互 换 位 置 。 这 个 操作 整 相 当 于 把 这 两 个 对 象 都 


move 到 了 其 他 地 方 。 如 果 这 两 个 对 象 存在 目 引 用 的 现象 ， 那 么 这 个 
swap 探 作 束 可 以 造成 它们 内 部 出 现 野 指针 。 而 PinMut<T> 类 型 残 不 存 
在 这 样 的 问题 。PinMut<T> 还 实现 了 DerefMut trait， 所 以 它 依然 有 权 
调用 那些 需要 &mnut Self 的 成 员 方 法 。 正 因为 PinMut 保 证 了 指 问 的 对 象 
不 可 move， 所 以 这 个 poll 方 法 就 可 以 不 用 unsafe 修 饰 了 。 


一 般 情 况 下 ， 实 现任 务 调度 以 及 为 通过 各 种 异步 操作 实现 Future 
trait 并 不 是 最 终 用 户 关 注 的 问题 ， 这 些 应 该 都 已 经 被 网 络 开 发 框架 完 
成 ， 比 如 tokio。 大 部 分 用 户 需 要 关注 的 是 如 何 利 用 这 些 框 架 完 成 业务 
逻辑 。 用 户 此 时 用 得 最 多 的 是 async 和 await 天 键 字 。 在 最 新 的 nightly 版 
本 中 ， 只 有 async 天 键 字 的 实现 已 完成 ，await 关 键 字 还 存在 争议 ， 它 目 
前 依然 是 使 用 宏 来 实现 的 。 一 个 基本 的 使 用 示例 如 下 所 示 : 


async fn async_fn(x: U8) -> u8 { 
let msg = await!(read_ from network()); 
let result = await!(calculate(msg, x)); 
result 


在 这 个 示例 中 ， 假 设 read_from_network () 以 及 calculate () 函数 
都 是 异步 的 。 最 外 层 的 async_fn 了 芳 数 当然 也 是 异步 的 。 当 代码 执行 到 
await! (read from network () ) 里 面 的 时 候 ， 发 现 异 步 操作 还 没有 
完成 ， 它 会 直接 退出 当前 这 个 函数 ， 把 CPU 证 给 其 他 任务 执行 。 当 这 
个 数据 从 网 络 上 传输 完成 了 ， 调 度 器 会 再 次 调用 这 个 函数 ， 它 会 从 上 
次 中 断 的 地 方 恢复 执行 。 所 以 用 asyncawait 的 语法 写 代 码 ， 异 步 代 码 
的 逻辑 在 源码 组 织 上 跟 同 步 代 码 的 逻辑 差别 并 不 大 。 这 里 面 状态 保存 
和 恢复 这 些 琐碎 的 事情 ， 都 由 编译 器 帮 有 我 们 完成 了 。 


下 面 给 大 家 解释 一 下 async 和 await 分 别 做 了 什么 事情 。 
async 天 键 字 可 以 修饰 函数 、 闭 包 以 及 代码 块 。 对 于 函数 : 


async fn fi(arg: U8) -> u8 人 


实际 上 等 同 于 : 


fn fi(arg: u8) -> impl Future<Output = u8> 人 © 


这 两 种 写法 实际 上 是 一 模 一 样 的 。 凡 是 被 async 修 饰 的 函数 ， 返 回 
的 都 是 一 个 实现 了 Future trait 的 类 型 。 由 async 修 饰 的 闭 包 也 是 一 样 
的 。async 代 码 块 同样 类 似 。 它 相当 于 创建 了 一 个 语句 块 表达 式 ， 这 个 
表达 式 的 返回 类 型 是 impl Future。async 天 键 字 不 仅 对 男 数 签 名 做 了 一 
个 改变 ， 而 且 对 函数 体 也 上 自动 做 了 一 个 包装 ， 被 async 关 键 字 包 起 来 的 
部 分 ， 会 目 动产 生 一 个 Generator， 并 把 这 个 Generator 包 闭 成 一 个 满足 
Se 。 在 函数 体 中 用 户 需 要 返回 的 是 Future: : Output 
类 型。 


对 于 await 这 个 宏 ， 我 们 可 以 在 标准 库 中 看 到 它 的 实现 : 


macro_rules! await { 
($e:expr) => { { 
let mut pinned = $e; 
let mut pinned = unsafe { $crate::mem::PinMut::new unchecked(&mut pinned) 


}; 
loop { 
match $crate::future::poll in task_cx(&mut pinned) { 
$crate::task::Poll: :Pending => yield, 
$crate::task::Poll: :Ready(x) => break x, 
} 
} 
}} 
} 


从 语法 上 来 讲 ，await 一 定 只 能 在 async 函 数 或 代码 块 中 出 现 ， 所 以 
它 实 际 上 是 被 包 在 一 个 Generator 里 面 的 。await 文 个 宏 的 逻辑 也 很 简 
单 ，await! (another_future) 所 做 的 事情 就 是 ， 先 构造 一 个 PinMut 指 
针 指 加 another_future， 然 后 调用 another_future 的 poll 方 法 。 如 果 其 处 于 
Pending 状 态 则 yield， 和 暂时 退出 这 个 Future。 每 当 调 度 器 恢复 它 的 执行 
时 ， 它 都 会 继续 调用 poll 方 法 ， 直 到 处 于 Ready 状 态 ， 这 时 候 这 个 await 
束 算 是 执行 完毕 了 了， 继续 执行 后 面 的 语句 。 


Se 如 果 基 于 async/await 写 程序 ， 看 起 来 会 是 什么 


async fn fetch_rust_lang(client: hyper::Client) -> io::Result<String> { 
let response = await!(client.get("https://www.rust-lang.org"))?; 
If Iresponse.status().is_ success() { 
return Err(io::Error::new(io::ErrorKind: :Other, "request failed")) 


let body = await!(response.body().concat())?; 
let string = String::from utf8(body)?; 


Ok(string) 


以 看 到 ， 使 用 async/await 来 写 异步 逻辑 ， 一 方面 可 以 保证 高 效 
== 放 面 ， 代码 流程 还 是 跟 阁 f 通 的 同步 逻辑 类 似 ， 比 较 符 合 直 
1 然 ， 我 们 也 可 以 不 用 这 个 语法 ， te | Hsp 组 
A 来 完成 同样 的 功能 ， 这 就 跟 上 文中 的 对 比 一 样 ， 其 与 async/await 的 
别 ， 就 与 手写 Iterator 和 Generator 之 间 的 区 别 一 样 。 


Ba 


第 26 章 ”标准 库 简 介 


除了 表面 介绍 过 的 容器 、 和 迭代 侨 之 外 ， 标 准 库 还 提供 了 一 系列 有 
胃 的 关 宇 ` 函数 、trait 等 。 本 章 挑选 其 中 比较 音 见 的 一 部 分 简单 介 
组 。 


26.1 关 型 转换 


Rust 给 我 们 提供 了 一 个 关键 子 as 用 于 基本 类 型 的 转换 。 但 是 除了 
基本 类 型 之 外 ， 还 有 更 多 的 目 定 义 类 型 ， 它 们 之 间 也 经 党 需要 做 类 型 
转换 。 为 此 ，Rust 标 准 库 给 我 们 提供 了 一 系列 的 trait 来 辅助 抽象 。 


26.1.1 AsRef/AsMut 


AsRef 这 个 trait 代 表 的 意思 是 ， 这 个 类 型 可 以 通过 调用 as_ref 方 
法 ， 得 到 男 外 一 个 类 型 的 共享 引 用 。 它 的 定义 如 下 : 


pub trait AsRef<T: ?Sized> { 
fn as_ref(&self) -> &T,; 
} 


人 
写 引 用 : 


pub trait AsMut<T: ?Sized> { 
fn as mut(&mut self) -> &mut TT; 
} 


比如 说 ， 标 准 库 里 面 的 String 类 型 ， 束 针对 好 几 个 类 型 参数 实现 了 
ASRef trait: 


impl] AsRef<str> for String 

impl] AsRef<[u8]> for String 
impl AsRef<OsStr> for String 
impl AsRef<Path> for String 


AsRef 这 样 的 trait 很 适合 用 在 泛 型 代码 中 ， 为 一 系列 类 型 做 统一 抽 
象 。 比如， 我 们 可 以 写 一 个 泛 型 画 数 ， 它 接受 各 种 类 型 ， 只 要 可 以 被 
转换 为 &[u8] 即 可 : 


fn iter_bytes<T: AsRef<[u8]>>(arg: T) { 
for i in arg,as_ref() { 
println!("{}", 1); 


fn main() { 
let s: String = String::from("this is a string"); 
Jet v: Vec<u8> = vec![1,2,3]; 
let c: &str = "hello"; 
// 相当 于 画 数 重 载 。 只 不 过 基于 泛 型 实现 的 重 载 , 一 定 需 要 重 载 的 参数 类 型 满足 某 种 共同 的 约 细 
iter_bytes(s); 
iter_bytes(v); 
iter_bytes(c); 


eal 


26.1.2 Borrow/BorrowMut 


Borrow 这 个 trait 设 计 得 与 AsRef 非 常 像 。 它 是 这 样 定义 的 : 


pub trait Borrow<Borrowed: ?Sized> { 
fn borrow(&self) -> &Borrowed; 
} 


可 以 说 ， 除 了 名 字 之 外 ， 它 和 AsRef 长 得 一 模 一 样 。 但 它们 的 设 
计 意 图 不 同 。 比 如 ， 和 针对 String 类 型 ， 它 只 实现 了 一 个 Borrow<str>: 


impl] Borrow<str> for String 


这 是 因为 这 个 trait 一 般 被 用 于 实现 某 些 重要 的 数据 结构 ， 比 如 
HashMap: 


impl HashMap { 
pub fn get<Q: ?Sized>(&self, k: &Q) -> Option<&V> 
where K: Borrow<Q>, 
Q: Hash + Eq 
{} 


和 BTreeMap: 


impl BTreeMap { 
pub fn get<Q: ?Sized>(&self, key: &Q) -> Option<&V> 
where K: Borrow<Q>, 
Q: Ord 
{} 


所 以 ， 它 要 求 borrow () 方法 返回 的 类 型 ， 必 须 和 原来 的 类 型 具 
备 同 样 的 hash 值 ， 以 及 排序 。 这 是 一 个 约定 ， 如 果实 现 Borrow trait 的 
时 候 违 反 了 这 个 约定 ， 那 么 把 这 个 类 型 放 到 HashMap 或 者 BTreeMap 里 
面 的 时 候 束 可 能 出 现 问 题 。 


26.1.3 From/Into 


AsRef/Borrow 做 的 类 型 转换 都 是 从 一 种 引用 &T 到 另 一 种 引用 &U 
的 转换 。 而 From/Into 做 的 则 是 从 任意 类 型 T 到 U 的 类 型 转换 : 


pub trait From<T> { 
fn from(T) -> Self; 
} 


pub trait Into<T> { 
fn into(self) -> T; 


显然 ，From 和 和 Into 是 互 逆 的 一 组 转换 。 如 果 T 实 现 了 From<U>， 那 
么 U 理 应 实现 Into<T>。 因 此 ， 标 准 库 里 面 提供 了 这 样 一 个 实现 : 


impl<T, U> Into<U> for T where U: From<T> 


fn into(self) -> UT 
U::from(self) 


用 目 然 语 言 朱 述 ， 意 思 束 是 : 如 果 存 在 U: From<T>， 则 实现 T: 
Into<U>。 


正 是 因为 标准 库 中 已 经 有 了 这 样 一 个 默认 实现 ， 我 们 在 需要 给 两 


1 写 一 个 From 束 够 了 ，Into 不 需要 上 自 
己 于 写 * 


比如 ， 标 准 库 里 面 已 经 给 我 们 提供 了 这 样 的 转换 : 


impl<'a> From<&'a str> for String 


这 意味 着 &str 类 型 可 以 转换 为 String 类 型 。 我 们 有 两 种 调用 方式 : 
一 种 是 通过 String: : from (&str) 来 使 用 ， 一 种 是 通过 &str: : into 
() 来 使 用 。 它 们 的 意思 一 样 : 


fn main() { 

let s: &'static str = "hello"; 

let Str1: String = s.into(); 

let str2: String = String::from(s); 
} 


另外 ， 由 于 这 几 个 trait 很 常用 ， 因 此 Rust 已 经 将 它们 加 入 到 prelude 
中 。 在 使 用 的 时 候 我 们 不 需要 写 use std: : convert: : From; 这 样 的 
语句 了 ， 包 括 AsRef、AsMut、Into、From、ToOwned 等 。 具 体 可 以 参 
见 ]libstd/prelude/v1.rs 源 代码 的 内 容 。 


标准 库 中 还 有 一 组 对 应 的 TryFrom/TryInto 两 个 trait， 它 们 是 为 了 处 
理 那 种 类 型 转换 过 程 中 可 能 发 生 转 换 错误 的 情况 。 因 此 ， 它 们 的 方法 
的 返回 类 型 是 Result 类 型 。 


26.1.4 ToOwned 


ToOwned trait 提 供 的 是 一 种 更 “汉化 ”的 Clone 的 功能 。Clone 一 般 是 
从 &T 类 型 变量 创造 一 个 新 的 T 类 型 变量 ， 而 ToOwned 一 般 是 从 一 个 &T 
类 型 变量 创造 一 个 新 的 U 类 型 变量 。 


在 标准 库 中 ，ToOwned 有 一 个 默认 实现 ， 即 调用 Clone 方法: 


impl<T> Toowned for T 
where T: Clone 
{ 
type Owned = TT; 
fn to_owned(&self) -> TH{ 
self.clone() 


fn clone_into(&self, target: &mut T) { 


target.clone_from(self); 


但 是 ， 它 还 对 一 些 特殊 类 型 实现 了 这 个 trait。 比 如 : 


impl<T: Clone> ToOwned for [T] { 
type Owned = Vec<T>; 


impl ToOwned for str { 
type Owned = String; 


而 且 ， 很 有 用 的 类 型 Cow 也 是 基于 ToOwned 实 现 的 : 


pub enum Cow<'a, B> 
where 

B: 'a + Toowned + ?Sized, 
{ 


Borrowed(&'a B), 
Owned(<B as ToOwned>: :Owned), 


26.1.5 ToString/FromStr 
ToString trait 提 供 了 其 他 类 型 转换 为 String 类 型 的 能 


pub trait ToString { 
fn to_string(&self) -> String; 
} 


一 般 情 况 下 ， 我 们 不 需要 目 己 为 目 定义 类 型 实现 ToString trait 。 
为 标准 库 中 已 经 提供 了 一 个 默认 实现 : 


impl<T: fmt::Display + ?Sized> ToString for T { 

#[inline] 

default fn to_string(&self) -> String { 
use core::fmt: :Write,; 
let mut buf = String::new(); 
buf .write_ fmt(format_args!("{}", self)) 

.expect("a Display implementation return an error unexpectedly"); 

buf.shrink_to_fit(); 
buf 


这 意味 着 ， 任 何 一 个 实现 了 Display trait 的 类 型 ， 都 自动 实现 了 
Tostring trait。 而 Display trait 是 可 以 自动 derive 的 ， 我 们 只 需要 为 类 型 
添加 一 个 attribute 即 可 。 


FromStr 则 提供 了 从 字符 串 切片 &str 问 其 他 类 型 转换 的 能 力 。 


pub trait FromStr { 

type Err， 

fn from_str(S: &str) -> Result<Self, Self::Err>,; 
} 


因为 这 个 转换 过 程 可 能 出 错 ， 所 以 from_str 方 法 的 返回 类 型 被 设计 
为 Result 。 


正 是 因为 有 了 这 个 trait， 所 以 str 类 型 才 有 了 一 个 成 员 方 法 parse: 


pub fn parse<F: FromStr>(&self) -> Result<F, F::Err> { .… } 


所 以 我 们 可 以 写 下 面 这 样 非 第 清晰 直 日 的 代码 : 


let four = "4".parse::<u32>(); 
assert_eq!(Ok(4), four); 


26.2 运算 衙 重 载 


Rust 人 允许 一 部 分 运算 符 重 载 ， 用 户 可 以 让 这 些 运算 符 文 持 目 定 义 
类 型 。 运 算 符 重 载 的 方式 是 ， 针 对 自 定义 类 型 ，impl 一 些 在 标准 库 中 
预定 义 好 的 trait， 这 些 trait 都 存在 于 std: : ops 模 块 中 。 比 如 前 面 已 经 
讲 过 了 的 Deref trait 束 属于 运算 和 从重 载 。 


本 章 我 们 以 最 基本 的 Add trait 来 做 讲解 。Add 代 表 的 是 加 法 运算 符 
+ 重 载 。 它 的 定义 是 : 


trait Add<RHS = Self> { 

type Output; 

fn add(self, rhs: RHS) -> Self::Output,; 
} 


它 具 备 一 个 泛 型 参数 RHS 和 一 个 关联 类 型 Output。 其 中 RHS 有 一 
个 默认 值 Self。 


标准 库 早 已 经 为 基本 数字 类 型 实现 了 这 个 trait。 比 如 : 


Impl1 Add<i32> for i32 { 
type Output = i32,; 


而 且 还 有 : 


impl<'a> Add<i32> for &'a i32 

type Output = <i32 as Add<i32>>: :Output; 
impl<'a> Add<&'a i32> for i32 

type Output = <i32 as Add<i32>>: :Output; 
impl<'a, 'b> Add<&'a i32> for &'b i32 

type Output = <i32 as Add<i32>>: :Output; 


这 意味 着 ， 不 仅 i32+i32 是 允许 的 ， 而 且 i32+&i32、&i32+i32、 
&i32+&i32 这 几 种 形式 也 都 是 允许 的 。 它 们 的 返回 类 型 都 是 i32 。 


假如 我 们 现在 目 己 定 义 了 一 个 复数 类 型 ， 想 让 它 文 持 加 法 运算 
符 ， 示 例如 下 : 


use std::ops::Add; 


#[derive(Copy, Clone, Debug, PartialEq)] 
Struct Complex { 

real : i32, 

imaginary : i32, 


} 


impl Add for Complex { 
type Output = Complex; 


fn add(self, other: Complex) -> Complex { 
Complex { 
real: self.real + other.real, 
imaginary: self.imaginary + other.imaginary, 


} 


fn main() { 
let ci = Complex { real: 1, imaginary: 2}; 
let c2 = Complex { real: 2, imaginary: 4}; 
println!("{:?2}", ci + c2); 


在 这 个 实现 中 ， 我 们 没有 指定 泛 型 参数 RHS， 所 以 它 束 采用 了 协 
认 值 ， 在 此 示例 中 就 相当 于 Complex 这 个 类 型 。 同 理 ， 如 果 我 们 希望 
让 这 个 复数 能 文 持 与 更 多 的 类 型 求 和 ， 可 以 继续 写 多 个 impl: 


impl<'a> Add<&'a Complex> for Complex { 
type Output = Complex; 


fn add(self, other: &'a Complex) -> Complex { 
Complex { 
real: self.real + other.real, 
imaginary: self.imaginary + other.imaginary, 


} 


impl Add<i32> for Complex { 
type Output = Complex; 


fn add(self, other: i32) -> Complex { 
Complex { 
real: self.real + other, 
imaginary: self.imaginary, 


26.3 LO 


标准 库 中 也 提供 了 一 系列 MO 相关 的 功能 。 虽 然 功能 比较 基础 ， 但 
0 。 如 采用 户 需 要 更 丰富 的 功能 ， 可 以 去 寻求 外 部 的 开 
源 库 。 


26.3.1 平台 相关 字符 串 


要 跟 操 作 系统 打交道 ， 首 先 需要 介绍 的 是 两 个 字符 串 类 型 
它 所 对 应 的 学 符 单 切片 关 型 OsStr 。 它 们 存在 于 std :人 fi 
员 O 


Rnust 标 准 的 字符 串 类 型 是 String 和 str。 它 们 的 一 个 重要 特点 是 保证 
了 内 部 编码 是 统一 的 utf-8。 但 是 ， 当 我 们 和 具体 的 操作 系统 打交道 
时 ， 统 一 的 utf-8 编 码 是 不 够 用 的 ， 某 些 操 作 系统 并 没有 规定 一 定 是 用 
的 utf- 8 编码 。 所 以 ， 在 和 操作 系统 打交道 的 时 候 ， _String/str 夫 型 并 个 

是 一 个 很 好 的 选择 。 比 如 在 Windows 系 统 上 ， 字 符 一 般 是 用 16 位 数字 

来 表示 的 。 

为 了 应 付 这 样 的 情况 ，Rust 在 标准 库 中 又 设计 了 OsString/OsStr 来 
处 理 这 样 的 情况 。 这 两 种 类 型 携带 的 方法 跟 String/str 非 党 类似， 用 起 
来 几乎 没什么 区 别 ， 它 们 之 间 也 可 以 相互 转换 。 


举 个 需要 用 到 OsStr 场 景 的 例子 : 


use std::path::PathBuf; 


fn main() { 
let mut buf = PathBuf::from("/"); 
buf.set_file name("bar"); 


if let Some(S) = buf.to_str() { 
println!("{}", s); 

} else { 

println!("invalid path"); 


上 面 这 个 例子 是 处 理 操 作 系统 中 的 路 径 ， 融 必须 用 OsString/OsStr 
这 两 个 类 型 。PathBuf 的 set_file_name 方 法 的 签名 是 这 样 的 : 


fn set_file name<S: AsRef<OsStr>>(&mut self, file name: S) 


它 要 求 ， 第 二 个 参数 必须 满足 AsRef<OsStr> 的 约束 。 而 查看 str 类 
型 的 文档 ， 我 们 可 以 看 到 |: 


impl AsRef<OsStr> for str 


所 以 ，&str 类 型 可 以 直接 作为 参数 在 这 个 方法 中 使 用 。 


另外 ， 当 我 们 想 把 &PathBuf 转 为 &str 类 型 的 时 候 ， 使 用 了 to_str 方 
法 ， 返 回 的 是 一 个 Option<&str> 类 型 。 这 是 为 了 错误 处 理 。 因 为 
PathBuf 内 部 是 用 OsString 存 储 的 字符 串 ， 它 未 必 能 成 功 转 为 utf-8 编 
码 。 而 想 要 把 &PathBuf 转 为 &OsStr 则 简单 多 了 ， 这 种 转换 不 需要 错误 
处 理 ， 因 为 它们 是 同样 的 编码 。 


26.3.2 ”文件 和 路 径 


Rnust 标 准 库 中 用 PathBuf 和 Path 两 个 类 型 来 处 理 路 径 。 它 们 之 间 的 
关系 就 类 似 String 和 str 之 间 的 关系 : 一 个 对 内 部 数据 有 所 有 权 ， 还 有 一 
个 只 是 借用 。 实 际 上 ， 读 源码 可 知 ，PathBuf 里 面 存 的 是 一 个 
OsString，Path 里 面 存 的 是 一 个 OsStr。 这 两 个 类 型 定义 在 std: : path 模 
RI 


Rnust 对 文件 操作 主要 是 通过 std: : fs: : File 来 完成 的 。 这 个 类 型 
定义 了 一 些 成 员 方 法 ， 可 以 实现 打开 、 创 建 、 复 制 、 修 改 权限 等 文件 
操作 。std: : ff 模块 下 还 有 一 些 独 立 函 数 ， 比 如 remove_file、soft_link 
等 ， 也 是 非常 有 用 的 。 


对 文件 的 读 写 ， 则 需要 用 到 std: : io 模块 了 。 这 个 模块 内 部 定义 
了 几 个 重要 的 trait， 比 如 Read/Write。File 类 型 也 实现 了 Read 和 Write 两 
个 trait， 因 此 它 拥 有 一 系列 方便 读 写 文件 的 方法 ， 比 如 read 、 
read_to_end、read_to_string 等 。 这 个 模块 还 定义 了 BufReader 等 类 型 。 


我 们 可 以 把 任何 一 个 满足 Read trait 的 类 型 再 用 BufReader 包 一 下 ， 实 现 
有 缓冲 的 读 取 。 


下 面 用 一 个 示例 来 演示 说 明 这 些 类 型 的 使 用 方法 : 


use std::io::prelude::*,; 
use std::io::BufReader,; 
Use std::fs::File,; 


fn test_read file() -> Result<(), std::io::Error> { 


let mut path = std::env::home_dir().unwrap(); 
path.push(".rustup"); 

path.push("settings"); 

path. set_extension("tom]l"); 


let file = File::open(&path)?; 
let reader = BufReader: :new(file); 


for line in reader.lines() { 
println!("Read a line: {}", line?),; 


ok( ()) 
} 


fn main() { 
match test_read file() { 
ok(_) => 全 


Err(e) => { 
println!("Error occured: {}", e); 


26.3.3 ”标准 输入 输出 


前 面 我 们 已 经 多 次 使 用 了 println! 宏 输出 一 些 信息 。 这 个 宏 很 方 
便 ， 特 别 适合 在 小 程序 中 随手 使 用 。 但 是 如 果 你 需要 对 标准 输入 输出 
作 更 精细 的 控制 ， 则 需要 使 用 更 复 洒 一 点 的 办 法 。 


在 C++ 里 面 ， 标 准 输 入 输出 流 cin、cout 是 全 局 变量 。 在 Rust 中 ， 
基于 线程 安全 的 考虑 ， 获 取 标 准 输入 输出 的 实例 需要 调用 函数 ， 分 别 
为 std: : io: : stdin () 和 std: : io: : stdout () ° stdin () 函数 返 
回 的 类 型 是 Stdin 结 构 体 。 这 个 结构 体 本 身 已 经 实现 了 Read trait， 所 
以 ， 可 以 直接 在 其 上 调用 各 种 读 取 方 法 。 但 是 这 样 做 效率 比较 低 ， 


为 为 了 线程 安全 考虑 ， 每 次 读 取 的 时 候 ， 它 的 内 部 都 需要 上 锁 。 提 高 
执行 效率 的 办 法 是 手动 调用 lock () 方法 ， 在 这 个 锁 的 期 间 内 多 次 调 
用 读 取 操作 ， 来 避免 多 次 上 锁 。 


示例 如 下 : 


USe std::io::prelude::*,; 
use std::io::BufReader,; 


fn test_stdin() -> Result<(), std::io::Error> { 
let stdin = std::io::stdin(); 
let handle = stdin.1lock(); 
let reader = BufReader::new(handle); 


for line in reader.lines() { 
let line = line?,; 
if line.is empty() { 
return Ok(()); 


} 
println!("Read a line: {}", line); 
} 


ok( ()) 


fn main() { 
match test_stdin() { 
ok(_) => 全 


Err(e) => { 
println!("Error occured: {}", e); 


26.3.4 ”进程 启动 参数 


大 家 应 该 注意 到 了 ，Rust 的 main 函 数 的 签名 和 C/C++ 不 一 至。 在 
C/C++ 里 面 ， 一 般 进 程 局 动 参数 是 直接 用 指针 传递 给 main 函 数 的 ， 进 
程 返回 值 是 通过 main 函 数 的 返回 值 来 决定 的 。 


在 Rust 中 ， 进 程 启动 参数 是 调用 独立 的 函数 std: : env: : args 
() 来 得 到 的 ， 或 者 使 用 std: : env: : args_os () 来 得 到 ， 进 程 返 
ee : process: : exit () 来 指定 的 。 示 例如 


fn main() { 
If std::env::args().any(|arg| arg == "-kill") { 
std: :process: :exit(1); 


for arg in std::env::args() { 
println!("{}", arg); 
} 
} 


同样 ， 标 准 库 只 提供 最 基本 的 功能 。 如 果 读 者 需要 功能 更 强大 、 
更 容易 使 用 的 命令 行 参数 解析 絮 ， 可 以 到 crates.io 上 搜索 相关 开源 库 ， 
clap 或 者 getopts 都 是 很 好 的 选择 。 


26.4 Any 


Rust 标 准 库 中 提供 了 一 个 乞丐 版 的 “反映 ?功能 ， 那 惑 是 std: : any 
模块 。 这 个 模块 内 ， 有 个 trait 名 字 叫 作 Any。 上 所 有 的 类 型 都 目 动 实现 了 
Any 这 个 trait， 因 此 我 们 可 以 把 任何 一 个 对 象 的 引用 转 为 &Any 这 个 trait 
object， 然 后 调用 它 的 方法 。 


它 可 以 判断 这 个 对 象 是 什么 类 型 ， 以 及 强制 转换 &Any 为 某 个 具体 
类 型 。 另 外 ， 成 员 函 数 get_type_id () 暂时 要 求 'static 约 束 ， 这 个 限制 
条 件 以 后 会 放宽 。 


基本 用 法 示例 如 下 : 


#![feature(get_type_id)] 


use std::fmt::Display; 
use std::any::Any; 


fn log<T: Any + Display>(value: &T) { 
let value any = value as &Any; 


If let Some(s) = value any.downcast_ref::<String>() { 
println!("String: {}", Ss); 


else if let Some(i) = value any.downcast_ref::<i32>() { 
println!("i32: {}", i); 

} else { 
let type_id = value any.get_ type_id(); 
println!("unknown type {:?}: {}", type_id, value); 


} 


fn do_work<T: Any + Display>(value: &T) { 
log(value); 


fn main() { 
let my_string = "Hello World".to_ string(); 
do_work(&my_string); 


let my_i32: i32 = 100; 
do_work(&my_i32); 


let my_char: char = '®'， 
do_work(&my_char ) ; 


第 四 部 分 ”线程 安全 


Rust 不 仅 在 没有 自动 垃圾 回收 (Garbage Coll-ection) 的 条 件 下 实 
现 了 内 存 安 全 ， 而 且 实 现 了 线程 安全 。Rnust 编 译 器 可 以 在 编译 阶段 避 
免 所 有 的 数据 竞争 〈Data Race) 问题 。 这 也 是 Rust 的 核心 竞争 力 之 
一 。 本 部 分 主要 讲解 Rust 是 如 何 实现 免疫 数据 竞争 的 。 


第 27 章 ”线程 安全 
27.1 什么 是 线程 


线程 是 操作 系统 能 够 进行 调度 的 最 小 单位 ， 它 是 进程 中 的 实际 运 
作 单 位 ， 每 个 进程 至 少 包含 一 个 线程 。 在 多 核 处 理 右 越 来 越 普 及 的 今 
天 ， 多 线程 编程 也 用 得 越 来 越 广泛 。 多 线程 的 优势 有 : 


:容易 利用 多 核 优 势 ; 

- 比 单 线程 反应 更 敏捷 ， 比 多 进程 资源 共享 更 容易 。 

多 线程 编程 在 许多 领域 是 不 可 或 缺 的 。 但 是 ， 多 线程 并 行 ， 非 常 
容易 引发 数据 竞争 ， 而 且 还 非 芝 不 容易 被 发 现 和 debug。 下 面 ， 我 们 用 


ee 


#include <iostream> 
#include <stdlib.h> 
#include <thread> 
#include <string> 


#define COUNT 1000000 
volatile int g_num = ©; 


void thread1() 
{ 


for (int i=0; i<COUNT; i++){ 
g_num++， 
} 


和 
void thread2() 


for (int i=0; i<COUNT; i++){ 
g_num--， 

} 

} 

int main(int argc, char* argv[]) 
std::thread ti1i(thread1); 
std::thread t2(thread2); 
t1.join(); 
t2.join(); 


std::cout << "final value:" << g_num << std::endl,; 


return 0; 


我 们 可 以 使 用 g++-pthread-std=c++11 temp.cpp 命 令 编 译 这 段 代 码 。 


在 这 段 代 码 中 ， 我 们 创建 了 两 个 线程 。 一 个 线程 去 修改 全 局 变 
global ， 循 环 1000000 次 加 1。 另 外 一 个 线程 也 去 修改 全 局 变 量 global， 
循环 1000000 次 减 1。 如 果 没 有 数据 竞争 的 话 ， 这 两 个 线程 执行 完毕 
后 ， 数 据 最 终 一 定 是 回 到 初始 值 0。 然 而 ， 我 们 尝试 运行 后 发 现 ， 每 次 
执行 的 结果 都 不 是 0， 而 且 每 次 的 结果 都 不 一 样 。 


为 什么 会 发 生 这 样 的 现象 呢 ? 这 是 因为 ， 为 普通 变量 加 1 减 1 这 样 
的 操作 并 非 “< 原子” 操作。 我们 人 简 化 一 下 这 个 过 程 ， 可 以 将 它 分 为 三 个 
步骤 : 读数 据 、 执 行 计 算 、 写 数据 。 理 想 情 况 下 ， 我 们 期 望 的 执行 流 
程 应 该 是 下 面 这 样 的 : 


= 人 = 0 
| 0 
加 | 0 
ET 

IE 
> 0 


然而 ， 线 程 的 调度 是 不 受 我 们 控制 的 ， 即 便 线 程 1 和 线程 2 内 部 的 
执行 流程 不 变 ， 只 要 调度 时 机 发 生 了 变化 ， 结 果 也 会 不 同 。 比 如 实际 
的 执行 过 程 中 ， 有 可 能 是 这 样 的 情况 : 


Thread 变量 值 
[ | 0 
读数 据 | 0 
加 1 0 
0 
1 
-1 


根据 调度 情况 的 不 同 ， 最 终 的 结果 也 会 有 所 差异 ， 所 以 我 们 可 以 
看 到 这 个 程序 的 执行 结果 不 是 0(， 而 且 循环 次 数 越 多 ， 发 生 数据 竞争 的 


机 会 也 越 大 。 


在 传统 的 系统 级 编程 语言 中 ， 写 多 线程 代码 很 容易 出 销 。 而 Rust 的 
0 


27.2 ”启动 线程 


Rust 标 准 库 中 与 线程 相关 的 内 容 在 std: : thread 模 块 中 。Rust 中 的 
线程 是 对 操作 系统 线程 的 直接 封装 。 


创建 线程 的 方法 为 : 


use std::thread; 


thread::spawn(move || { 
// 这 里 是 新 建 线程 的 执行 逻辑 
}); 


默认 情况 下 ， 新 创建 的 子 线程 与 原来 的 父 线程 是 分 离 的 关系 。 也 
就 是 说 ， 子 线程 可 以 在 父 线程 结束 后 继续 人 存在， 除非 父 线程 是 主线 
程 。 因 为 我 们 知道 ， 如 果 一 个 进程 的 主线 程 也 退出 了 ， 这 个 进程 束 会 
终止 ， 其 他 所 有 的 线程 也 会 随 之 结束 。 


如 果 我 们 需要 等 待 子 线程 执行 结束 ， 那 么 可 以 使 用 join 方 法 : 


use std::thread; 
// child 的 类 型 是 JoinHandle<T>, 这 个 T 是 闭 包 的 返回 类 型 
let child = thread::spawn(move || { 

// 子 线程 的 逻辑 


}); 
// 父 线程 等 待 子 线程 结束 
let res = child.join(); 


如 果 我 们 需要 为 子 线程 指定 更 多 的 参数 信息 ， 那 么 在 创建 的 时 候 
可 以 使 用 Builder 模 式 : 


use std::thread; 


thread: :Builder::new().name("childi".to_ string()).spawn(move || { 
println!("Hello, world!"); 
}); 


thread 模 块 还 提供 了 下 面 几 个 工具 函数 。 


(1) thread: : sleep (dur: Duration) 


使 得 当前 线程 等 待 一 段 时 间 继 续 执 行 。 在 等 待 的 时 间 内 ， 线 程 调 
度 圳 会 调度 其 他 的 线程 来 执行 。 


(2) thread: : yield now () 

放弃 当前 线程 的 执行 ， 要 求 线程 调度 器 执行 线程 切换 。 
(3) thread: : current () 

获得 当前 的 线程 。 

(4) thread: : park () 


暂停 当前 线程 ， 进 入 等 待 状态 。 当 thread: : Thread: : unpark 
(&self) 方法 被 调用 的 时 候 ， 这 个 线程 可 以 被 恢复 执行 。 


(5) thread: : Thread: : unpark (&self) 
恢复 一 个 线程 的 执行 。 
以 上 函数 的 综合 使 用 见 如 下 示例 : 


use std::thread; 
use std::time::Duration; 


fn main() { 
let t = thread::Builder::new() 
,name("child1" .to_string()) 
,Spawn(move || { 
println!("enter child thread."); 
thread: :park(); 
println!("resume child thread"); 
}) .unwrap( ); 
println!("spawn a thread"),; 
thread: :sleep(Duration: :new(5,0)); 
t.thread().unpark(); 
t.join(); 
println!("child thread finished"); 


27.3 ”人 免 数据 苋 争 


粗 看 起 来 ，Rust 的 多 线程 API 很 人 镜 单 。 但 其 实 ， 其 表面 的 位 洁 之 下 
隐藏 大 天 键 的 创新 设计 。 正 可 谓 : 


胸 有 激 雷 而 面 如 平 调 者 ， 可 拜 上 将 军 也 ! 


为 了 说 明 Rust 在 多 线程 方面 的 威力 ， 我 们 来 做 几 个 实验 ， 看 看 如 
条 用 多 个 线程 读 写 同一 个 变量 会 发 生 什 么 情况 。 


我 们 创建 一 个 子 线程 ， 用 它 修改 一 个 外 部 变量 : 


use std::thread; 
fn main() { 
let mut health = 12; 


thread::spawn( || { 
ealth 2 
}); 
println!("{}", health); 
编译 ) 发 生 错 误 错误 信息 为 。 


error: closure may outlive the current function, but it borrows health, which is 
owned by the current function 


根据 前 面 的 知识 可 以 知道 ，spawn 函 数 接受 的 参数 是 一 个 财 包 。 
我 们 在 闭 包 里 面 引 用 函 数 体内 的 局 部 变量 ， 而 这 个 闭 包 是 运行 在 男 
外 一 个 线程 上 ， 编 译 絮 无 法 肯定 局 部 变量 health 的 生命 周期 一 定 大 于 闭 
包 的 生命 周期 ， 于 是 发 生 了 错误 。 


那 我 们 对 这 个 程序 做 一 个 修改 ， 把 团 包 加 上 move 修 饰 。 再 次 编 
译 ， 可 见 编译 错误 已 经 消失 。 但 是 执行 发 现 ， 变 量 health 的 值 并 未 发 生 
改变 。 为 什么 呢 ? 因为 health 是 Copy 类 型 ， 在 遇 到 move 型 财 包 的 时 
让 ， 外 面 的 变量 并 没有 被 真正 
小 改 。 


如 果 我 们 使 用 的 是 非 Copy 类 型 ， 又 会 怎样 呢 ? 


use Std::thread ; 
fn main() { 
let mut v : Vec<i32> = vec![]; 
thread::spawn( || { 
v.push(1); 
}); 


println!i("{:?}", VvV); 


编译 ， 出 现 同样 的 错误 。 再 次 尝试 给 闭 包 加 上 move， 还 是 出 现 纺 
译 错误 : 


error: use of moved value: V 


这 个 错误 也 好 理解 : 既然 我 们 已 经 把 v 移 动 到 了 闭 包 里 面 ， 那 么 它 
在 本 函数 内 束 不 能 再 继续 使 用 了 ， 因 为 其 所 有 权 已 经 移 走 了 。 


以 上 这 几 个 试验 全 部 失败 了 ， 那 我 们 究 葛 怎样 做 才能 让 一 个 变量 
在 不 同 线程 中 共 至 呢 ? 


答案 是 : 我 们 没有 办 法 在 多 线程 中 直接 读 写 普通 的 共 至 变量 ， 
非 使 用 Rust 提 供 的 线程 安全 相关 的 设施 。 


也 就 是 说 ，Rust 给 我 们 提供 了 一 个 重要 的 安全 保证 : 


A 
2 


~ 


The compiler prevents all data races. 


“data race” 即 数据 苋 争 ， 意 思 是 在 多 线程 程序 中 ， 不 同 线程 在 没有 
0 
Y 情 ; 0 


在 笔者 看 来 ， 这 是 一 项 晶 命 性 的 进步 ， 非 常 值得 关注 。 
在 许多 传统 〈 非 函数 式 ) 的 编程 语言 中 ， 并 行程 序 设 计 是 非常 困 


难 的 ， 原 因 束 在 于 代码 中 存在 大 量 的 共 至 状态 和 很 多 隐藏 的 数据 依 
赖 。 程 序 员 必须 非 第 清楚 代码 的 流程 ， 使 用 合适 的 策略 正确 实现 并 发 


控制 。 而 万 一 某 人 在 某 个 地 方 犯 了 一 个 小 错误 ， 那 么 这 个 程序 束 成 了 
不 安全 的 ， 而 且 没 有 什么 静态 检查 工具 可 以 保证 完整 无 遗漏 地 将 此 类 
问题 检查 出 来 。 对 于 一 份 规模 比较 大 的 C/C++ 源 代 码 ， 我 们 没有 什么 
好 办 法 “证 明 ” 一 个 程序 古 不 是 “线程 安全 ”的 。 况 且 ， 人 非 圣 吧 ， 绿 能 
无 过 ， 殉 像 墨 菲 定律 说 的 那样 : 


Anything that can go wrong, will go wrong. 


Murphey’s Law 


有 很 多 人 尝试 过 很 多 办 法 ， 来 从 根源 上 解决 数据 竞争 (Data 
race) 的 问题 。 根 据 数据 竞争 的 定义 ， 它 的 发 生 需 要 三 个 条 件 : 


"数据 共 至 一 一 有 多 个 线程 同时 访问 一 份 数据 ; 
"数据 修改 一 一 至 少 存在 一 个 线程 对 数据 做 修改 ; 
没有 同步 一 一 至 少 存在 一 个 线程 对 数据 的 访问 没有 使 用 同步 措 


施 
我 们 只 要 让 这 三 个 条 件 无 法 同时 发 生 即 可 : 


“可 以 禁止 数据 共 诗 ， 比 如 actor-based concurrency， 多 线程 之 间 的 
通信 仅 靠 发 送 消息 来 实现 ， 而 不 是 通过 共 吾 数据 来 实现 ; 


可 以 禁止 数据 修改 ， 比 如 functional programming， 许 多 函数 式 编 
程 语言 严格 限制 了 数据 的 可 变性 ， 而 对 共享 性 没有 限制 。 


然而 以 上 设计 在 许多 情况 下 都 有 一 些 性 能 上 的 缺陷 ， 无 法 达到 " 零 
开销 抽象 "的 目的 。 


Rust 并 没有 盲目 跟随 传统 语言 的 脚步 设计 。Rust 允 许 存 在 可 变 变 
量 ， 人 允许 存在 状态 共享 ， 同 时 也 做 到 了 完整 无 和 遗漏 的 线程 安全 检查 。 
因为 Rust 设 计 的 一 个 核心 思想 就 是 “共享 不 可 变 ， 可 变 不 共享 ”， 然 后 
再 加 上 类 型 系统 和 合理 的 API 设 计 ， 束 可 以 保证 共享 数据 在 访问 时 一 
定 使 用 了 同步 措施 。Rust 既 可 以 文 持 多 线程 数据 共享 的 风格 ， 也 可 以 
。 无论 选择 哪 种 方案 ， 编 译 需 都 能 保证 没有 数据 
竞争 。 


请 注意 这 个 区 别 : 我 们 不 是 说 传统 C/C++ 束 无 法 做 到 线程 安全 ， 
而 是 说 ,传统 C/C++ 需要 依赖 程序 员 不 犯错 误 来 保证 线程 安全 ;， 而 


Rust 是 由 工具 自动 保证 的 ， 这 个 保证 更 稳定 、 更 可 靠 、 更 有 底气 。 虽 
然 C/C++ 里 面 也 有 许多 静态 检查 工具 ， 可 以 辅助 我 们 目 动 发 现 一 些 线 
程 安 全 问题 ,但 是 由 于 C/C++ 灵活 度 太 大 、 目 由 度 太 高 ， 因 此 可 以 肯 
定 的 是 没有 任何 一 款 静 态 检查 工具 可 以 保证 百 分 百 “无 遗漏 、 无 误 
报 ” 的 线程 安全 检查 。 现 在 没有 ， 将 来 也 不 可 能 有 。 所 以 不 得 不 依赖 程 
序 员 的 水 平 。 在 代码 规模 大 到 一 定 程 度 之 后 ， 这 种 做 法 是 不 可 靠 的 ， 
不 论 一 个 人 实力 有 多 强 ， 总 有 马虎 的 时 候 、 疲 惫 的 时 候 、 情 绪 不 民 的 
时 候 ， 偶 尔 犯 错 是 不 可 避免 的 ， 更 何况 大 规模 的 团队 存在 管理 配合 问 
题 、 人 员 流 动 交 接 问 题 等 ， 一 不 小 心 束 会 埋 下 一 个 隐患 。 作 为 对 比 ， 
Rust 对 线程 的 安全 检查 是 稳定 的 、 可 靠 的， 不 因 时 因 地 而 有 所 流动， 
不 因 代码 量 的 多 少 或 复杂 程度 而 懈 候 。 这 个 特点 ， 对 于 某 些 对 安全 性 
要 求 很 高 的 场景 具有 非 同 寻 利 的 意义 。 


这 个 区 别 赋予 了 Rust 一 种 特殊 的 能 力 ， 它 使 Rust 的 使 用 者 有 了 更 
强大 的 目 信 ， 让 Rust 的 使 用 者 有 胆量 使 用 更 激进 的 并 行 优化 。 


27.4 Send & Sync 


下 面 来 简单 讲解 一 下 Rust 是 如 何 实 现 免 疫 数据 竞争 的 。Rust 线 程 
安全 背后 的 功臣 是 两 个 特殊 的 trait 。 


‘std: : marker: : Sync 


如 条 类 型 IT 实现 了 Sync 类 型 ， 那 说 明 在 不 同 的 线程 中 使 用 &T 访 问 


同一 个 变量 是 安全 的 。 
std: : marker: : Send 


如 果 类 型 TI 实现 了 Send 类 型 ， 那 说 明 这 个 类 型 的 变量 在 不 同 的 线 
程 中 传递 所 有 权 是 安全 的 。 


Rnust 把 类 型 根据 Sync 和 Send 做 了 分 类 。 这 样 做 起 什么 作用 呢 ? 当 
然 是 用 在 “ 泛 型 约束 ”中 。Rust 中 所 有 跟 多 线程 有 天 的 API， 会 根据 情 
况 ， 要 求 类 型 必须 满足 Sync 或 者 Send 的 约束 。 这 样 一 来 , “ 孙 猴 子 就 永 
远 也 逃 不 出 如 来 佛 的 手掌 心 ” 了 。 你 不 可 能 随意 在 多 线程 之 间 共 享 变 
量 ， 也 不 可 能 在 使 用 多 线程 共享 的 时 候 走 记 加 锁 。 除 非 你 使 用 
unsafe， 人 否则 不 可 能 写 出 存在 “数据 竞争 ”的 代码 来 。 


比如 我 们 最 常见 的 创建 线程 的 砂 数 spawn， 它 的 完整 数 签名 十 
这 样 的 : 


pub fn spawn<F, T>(f: F) -> JoinHandle<T> 
where F: Fnonce() -> T, F: Send + 'static, T: Send + 'static 


我 们 需要 注意 的 是 ， 参 数 类 型 F 有 重要 的 约束 条 件 F: 
Send+'static，T: Send+'static。 但 凡 在 线程 之 间 传 递 所 有 权 会 发 生 安全 
问题 的 类 型 ， 都 无 法 在 这 个 参数 中 出 现 ， 否 则 就 是 编译 错误 。 男 外 ， 
Rust 对 全 局 变量 也 有 很 多 限制 ， 你 不 可 能 简单 地 通过 全 局 变量 在 多 线 
程 中 随意 共 吝 状态。 这样 ， 编 译 器 就 会 禁止 掉 可 能 有 人 危险 的 线程 间 共 
享 数 据 的 行为 。 


在 Rust 中 ， 线 程 安 全 是 默认 行为 ， 大 部 分 类 型 在 单线 程 中 是 可 以 
随意 共享 的 ， 但 是 没 办 法 直接 在 多 线程 中 共享 。 也 就 是 说 ， 只 要 程序 
员 不 滥用 unsafe，Rust 编 译 右 束 可 以 检查 出 所 有 具有 “数据 竞争 ”潜在 风 
险 的 代码 。 凡 是 通过 了 编译 检查 的 代码 ，Rust 可 以 保证 ， 绝 对 不 会 出 
现 “ 线 程 不 安全 ”的 行为 。 如 此 一 来 ， 多 线程 代码 和 单线 程 代码 束 有 了 
严格 的 分 野 。 一 般 情 况 下 ， 我 们 不 需要 考虑 多 线程 的 问题 。 即 便 是 万 
中 访问 了 原本 只 设计 为 单线 程 使 用 的 代码 ， 编 译 恬 

研 月 : 


第 28 章 ”详解 Send 和 Sync 


在 上 文中 我 们 已 经 提 到 ，Rust 实 现 免疫 数据 竞争 的 关键 是 Send 和 
Sync 这 两 个 trait。 那 么 这 两 个 trait 究 疯 表 达 了 什么 意思 ? 它们 背后 十 什 
么 原理 ? 我 们 在 本 章 详细 分 析 。 


28.1 什么 是 Send 


根据 定义 : 如 果 类 型 T 实 现 了 Send trait， 那 说 明 这 个 类 型 的 变量 在 
不 同 线程 中 传递 所 有 权 是 安全 的 。 但 这 句 话 对 于 初学 者 并 不 是 那么 容 
Se 。 究 竟 具 备 什么 特点 的 类 型 才 满 足 Send 约 束 ?” 本 万 就 来 详细 
分 一 一 o 


如 果 一 个 类 型 可 以 安全 地 从 一 个 线程 move 进 入 另 一 个 线程 ， 那 它 
就 是 Send 类 型 。 比 如 : 普通 的 数字 类 型 是 Send， 因 为 我 们 把 数字 move 
进入 另 一 个 线程 之 后 ， 两 个 线程 同时 执行 也 不 会 造成 什么 安全 问题 。 


更 进一步 ， 内 部 不 包含 引用 的 类 型 ， 都 是 Send。 因 为 这 样 的 类 型 
跟 外 界 没 有 什么 关联 ， 当 它 被 move 进 入 另 一 个 线程 之 后 ， 它 所 有 的 部 
i 不 会 出 现 并 发 访问 的 情况 。 比 如 
String 类 型 。 


稍微 复杂 一 点 的 ， 具 有 泛 型 参数 的 类 型 ， 是 否 满足 Send 大 多 是 取 
决 于 参数 类 型 是 否 满足 Send。 比 如 Vec<T>， 只 要 我 们 能 保证 T: 
Send， 那 么 Vec<T> 肯 定 也 是 Send， 把 它 move 进 入 其 他 线程 是 没什么 问 
题 的 。 再 比如 Cell<T>、RefCell<T>、Option<T>、Box<T>， 也 都 是 这 
种 情况 。 


还 有 一 些 类 型 ， 不 论 泛 型 参数 是 否 满足 Send， 都 是 满足 Send 的 。 
这 种 类 型 ， 可 以 看 作 一 种 “构造 磺 ”， 把 不 满足 Send 条 件 的 类 型 用 它 包 
起 来 ， 就 变 成 了 满足 Send 条 件 的 类 型 。 比 如 Mutex<T> 就 是 这 种 。 
Mutex<T> 这 个 类 型 实际 上 不 关心 它 内 部 类 型 是 怎样 的 ， 反 正 要 访问 内 
部 数据 ， 一 定 要 调用 lock () 方法 上 锁 ， 它 的 所 有 权 在 哪个 线程 中 并 
不 重要 ， 所 以 把 它 move 到 其 他 线程 也 是 没有 问题 的 。 


那么 什么 样 的 类 型 是 ! Send 呢 ? 典型 的 如 Rc<T> 类 型 。 我 们 知 
道 ，Rc 是 引用 计数 指针 ， 把 Rc 类 型 的 变量 move 进 入 男 外 一 个 线程 ， 只 
征 其 中 一 个 引用 计数 指针 move 到 了 其 他 线程 ， 这 样 会 导致 不 同 的 线程 
中 的 Rc 变 量 引用 同一 块 数据 ，Rc 内 部 实现 没有 做 任何 线程 同步 处 理 ， 
这 征 肯 定 有 问题 的 。 所 以 标准 库 中 早已 指定 Rc 是 ! Send。 当 我 们 试图 
在 线程 边 办 传递 这 个 类 型 的 时 候 ， 束 会 出 现 编译 错误 。 


但 是 相对 的 是 ，Arc<T> 类 型 是 符合 Send 的 (当然 需要 T: 
Send) 。 为 什么 呢 ? 因为 Arc 类 型 内 部 的 引用 计数 用 的 是 “原子 计数 ”， 
对 它 进行 增 减 操作 ， 不 会 出 现 多 线程 数据 竞争 。 所 以 ， 多 个 线程 拥有 
指向 同一 个 变量 的 Arc 指 针 是 可 以 接受 的 。 


28.2 人 十 Syne 


对 应 的 ，Sync 的 定义 是 ， 如 果 类 型 T 实 现 了 Sync trait， 那 说 明 在 不 
同 的 线程 中 使 用 &T 访 问 同一 个 变量 是 安全 的 。 这 人 句 话 也 不 好 理解 。 下 
面 我 们 仔细 分 析 一 下 哪些 类 型 是 满足 Sync 约束 的 。 


显然 ， 基 本 数字 类 型 肯定 是 Sync。 假 如 不 同 线程 都 拥有 指向 同一 
个 132 类 型 的 只 读 引用 &i32， 这 是 没什么 问题 的 。 因 为 这 个 类 型 引用 只 
能 读 ， 不 能 写 。 多 个 线程 读 同一 个 整数 是 安全 的 。 


大 部 分 具有 泛 型 参数 的 类 型 是 否 满足 Sync， 很 多 都 症 取决 于 参数 
型 是 否 满足 Sync。 像 Box<T>、Vec<T>Option<T> 这 种 也 是 Sync 的 ， 
要 其 中 的 参数 T 是 满足 Sync 的 。 


也 有 一 些 类 型 ， 不 论 泛 型 参数 是 否 满足 Sync， 它 都 是 满足 Sync 
的 。 这 种 类 型 把 不 满足 Sync 条 件 的 类 型 用 它 包 起 来 ， 允 变 成 了 满足 
Sync 条 件 的 。Mutex<T> 束 是 这 种 。 多 个 线程 同时 拥有 &Mutex<T> 型 引 
用 ， 指 辣 同 一 个 变量 是 没 问 题 的 。 


那么 什么 样 的 类 型 是 ! Sync 呢 ? 所 有 具有 “内 部 可 变性 ”而 又 没有 
多 线程 同步 考虑 的 类 型 都 不 是 Sync 的 。 比 如 ，Cell<T> 和 RefCell<T> 就 
不 能 是 Sync 的 。 按 照 定 义 ， 如 果 我 们 多 个 线程 中 都 持 有 指 问 同一 个 变 
量 的 &Cell<T> 型 指针 ， 那 么 在 多 个 线程 中 ， 都 可 以 执行 Cell; : set 方 
法 来 修改 它 里 面 的 数据 。 而 我 们 知道 ， 这 个 方法 在 修改 内 部 数据 的 时 
候 ， 是 没有 考虑 多 线程 同步 问题 的 。 所 以 ， 我 们 必须 把 它 标 记 为 ! 
Sync° 


还 有 一 些 特殊 的 类 型 ， 它 们 既 具 备 内 部 可 变性 ， 又 满足 Sync 约 
束 ， 比 如 前 面 提 到 的 Mutex<T> 类 型 。 为 什么 说 Mutex<T> 有 具备 内 部 可 
变性 ? 大 家 但 一 下 文档 就 会 知道 ， 这 个 类 型 可 以 通过 不 可 变 引 用 调用 
lock () 方法 ， 返 回 一 个 智能 指 守 MutexGuard<T> 类 型 ， 而 这 个 智能 
和 有 权 修 改 内 部 数据 。 这 个 做 法 就 跟 RefCell<T> 的 try_borrow_mut 

() 方法 非常 类 似 。 区 别 只 是 : Mutex: : lock () 方法 的 实现 ， 使 用 
了 操作 系统 提供 的 多 线程 同步 机 制 ， 实 现 了 线程 同步 ， 保 证 了 异步 安 
全 ; 而 RefCell 的 内 部 实现 就 是 简单 的 普通 数字 加 减 操 作 。 因 此 ， 
Mnutex<T> 既 具备 内 部 可 变性 ， 又 满足 Sync 约束 。 除 了 Mnutex<T> ， 标 


类 
口 
> 


准 库 中 还 有 RwLock<T>、AtomicBool、AtomicIsize、AtomicUsize、 
AtomicPtr 等 类 型 ， 都 提供 了 内 部 可 变性 ， 而 且 满 足 Sync 约 束 。 


28.3 ”自动 推理 


Send 和 Sync 是 marker trait。 在 Rust 中 ， 有 一 些 trait 是 在 std: : 
marker 模 块 中 的 特殊 trait。 它 们 有 一 个 共同 的 特点 ， 束 是 内 部 都 没有 任 
何 的 方法 ， 它 们 只 用 于 给 类 型 做 “标记 ”。 在 std: : marker 这 个 模块 中 
1 都 是 给 类 型 做 标记 的 trait。 每 一 种 标记 都 将 类 型 严格 切 分 成 了 

组。 


我 们 可 以 从 源码 中 的 srclibcore/markerrs 中 看 到 : 


unsafe impl Send for .. 
unsafe impl Sync for .. 


{} 
{} 

这 是 一 个 临时 的 、 特 殊 的 语法 ， 它 的 含义 是 : 针对 所 有 类 型 ， 默 
认 实 现 了 Send/Sync。 使 用 了 这 种 特殊 语法 的 trait 叫 作 OIBIT (Opt-in 
built-in trait) ， 后 来 改称 为 Auto Trait。 注 意 : 这 个 语法 是 不 稳定 的 ， 
以 后 会 改变 。 不 管 怎 样 ， 编 译 需 留 了 一 个 后 门 ， 可 以 让 我 们 定义 Auto 
Trait ° 


Auto Trait 有 一 个 重要 特点 | 了 驶 是 编译 器 允许 用 户 不 用 手写 impl， 
目 动 根据 这 个 类 型 的 成 员 “推理 ?出 这 个 类 型 是 否 满足 这 个 trait 。 


我 们 可 以 手动 指定 这 个 类 型 满足 这 个 trait 约 束 ， 也 可 以 手动 指定 
它 个 满足 这 个 trait 约 束 ， 但 是 手动 指定 的 时 候 ， 一 定 要 用 unsafe 关 键 
子 O 〇 


比如 ， 在 标准 库 中 就 有 这 样 的 代码 : 


unsafe impl<T: ?Sized> !Send for *const T{ } 

unsafe impl<T: ?Sized> !Send for *mut T { 了 

unsafe impl<'a, T: Sync + ?Sized> Send for &'aT 

unsafe impl<'a, T: Send + ?Sized> Send for &'a mut T {} 
状 i 


使 用 ! Send 这 种 写法 表示 “ 取 反 ” 控 作 ， 这 些 类 型 就 一 定 不 满足 
Send 约 束 。 


请 大 家 一 定 要 注意 unsafe 天 键 字 。 这 个 关键 字 在 这 里 的 意思 是 ， 
编译 右 目 己 并 没有 能 力 正确 地 、 知 能 地 理解 每 一 个 类 型 的 内 部 实现 原 
理 ， 并 由 此 判断 它 是 否 满足 Send 或 者 Sync。 它 需要 程序 员 来 提供 这 个 
信息 。 此 时 ， 编 译 侨 选择 相信 程序 员 的 判断 。 但 同时 ， 这 两 个 trait 对 
于 “线程 安全 ”至 关 重 要 ， 如 采 程 序 员 目 己 在 这 里 判断 错 了 ， 束 可 能 制 
造 出 “线程 不 安全 ”的 问题 。 


所 以 ， 这 里 的 规则 和 前 面 讲 的 “内 存 安全 ”的 情况 是 一 样 的 。 某 些 
情况 下 ， 程 序 员 知 要 做 克 层 操作 的 时 候 ， 编 译 右 没有 能 力 判 断 这 部 分 
古 不 是 满足 内 存 安 全 ， 束 需要 程序 员 把 这 部 分 代码 用 unsafe 关 键 字 包 
起 来 ， 由 程序 员 去 负责 安全 性 。unsafe 关 键 字 的 意义 不 是 说 这 段 代 
码 “ 不 安全 ””， 而 是 说 这 段 代码 的 安全 性 编译 右 目 己 无 法 智能 检查 出 
来 ， 需 要 由 程序 员 来 保证 。 


标准 库 中 把 所 有 基本 类 型 ， 以 及 标准 库 中 定义 的 类 型 ， 都 做 了 合 
适 的 Send/Sync 标 记 。 


同时 ， 由 于 Anuto trait 文 个 机 制 的 存在 ， 绝 大 部 分 用 户 创建 的 目 定 
义 类 型 ， 本 身 都 已 经 有 了 合理 的 Send/Sync 标 记 ， 用 户 不 需要 手动 修改 
它 。 只 有 一 种 情况 例外 : 用 户 用 了 unsafe 代 码 的 时 候 ， 有 些 类 型 束 很 
可 能 需要 手动 实现 Send/Sync。 比 如 做 FFI， 在 Rust 项 目 中 调用 C 的 代 
码 。 这 种 时 候 ， 类 型 内 部 很 可 能 会 包含 一 些 裸 指针 ， 各 种 方法 调用 也 
会 有 许多 unsafe 代 码 块 。 此 时 ， 一 个 类 型 是 否 满 足 Send/Sync 就 不 能 依 
赖 Auto Trait 机 制 由 编译 器 推理 了 ， 因 为 它 推理 出 来 的 结论 很 可 能 是 错 
的 。 程 序 员 需要 根据 Send/Sync 所 表达 的 概念 去 理解 这 个 类 型 的 逻辑 ， 
然后 自己 判断 出 它 是 否 满足 Send/Sync 的 约束 。 在 这 种 情况 下 ， 写 这 个 
库 的 程序 员 束 成 了 实现 “线程 安全 ”目标 的 重要 一 环 。 如 果 写 错 了 ， 殉 
会 对 下 游 用 户 造 成 致命 的 影响 ， 所 有 依赖 于 这 个 库 的 代码 都 有 可 能 引 
发 线程 不 安全 。 


28.4 小结 


Rust 语 言 本 号 并 不 知晓 “线程 “并 发 "具体 是 什么 ， 而 是 抽象 出 了 
一 些 更 高 级 的 概念 Send/Sync， 用 来 摘 述 类 型 在 并 发 环境 下 的 特性 。 
std: : thread: : spawn 芳 数 就 是 一 个 普通 画 数 ， 编 译 句 没有 对 它 做 任 
何 特殊 处 理 。 它 能 保证 线程 安全 的 关键 是 ， 它 对 参数 有 合理 的 约束 条 
件 。 这 样 的 设计 使 得 Rust 在 线程 安全 方面 具备 非常 好 的 扩展 性 。 很 多 
高 级 的 并 发 模型 ， 在 Rust 中 都 可 以 通过 第 三 方 库 的 形式 实现 ， 而 且 可 
以 保证 线程 安全 特性 。 只 要 对 外 API 设 计 得 合理 ， 客 户 就 可 以 随便 使 
用 这 些 并 行 库 ， 而 不 会 有 数据 竞争 的 风险 。 


Rust 的 这 个 设计 实际 上 将 开发 者 分 为 了 两 个 阵营 ， 一 部 分 是 核心 
库 的 开发 者 ， 一 部 分 是 业务 逻辑 开发 者 。 对 于 一 般 的 业务 开发 者 来 
说 ， 完 全 没有 必要 写 任 何 unsafe 代 码 ， 更 没有 必要 为 目 己 的 目 定义 类 
型 去 实现 Sync Send， 和 直接 依赖 编译 侨 的 上 自动 推 寻 即 可 。 这 个 阵营 中 的 
程序 员 可 以 完全 至 受 编 译作 和 基础 库 带 来 的 安全 性 保证 ， 无 须 投 入 太 
多 精力 去 管理 细节 ， 极 大 地 减轻 脑力 负担 。 


而 对 于 核心 库 的 开发 者 ， 则 必须 对 Rust 的 这 套 机 制 非 常 了 解 。 比 
如 ， 他 们 可 能 需要 设计 自己 的 “无 锁 数据 类 型 “线程 池 ”*“ 管 道 ” 等 各 种 
并 行 编程 的 基础 设施 。 这 种 时 候 ， 就 有 必要 对 这 些 类 型 使 用 unsafe 
impl Send/Sync 设 计 合 适 的 接口 。 这 些 库 本 号 的 内 部 实现 是 基于 unsafe 
代码 做 的 ， 它 圣 受 不 到 编译 器 提供 的 各 种 安全 检查 。 相 反 ， 这 些 库 本 
吴 才 是 保证 业务 逻辑 代码 安全 性 的 关键 。 


这 个 区 分 对 整个 生态 圈定 有 好 处 的 。 跟 前 面 讲 的 “内 存 安全 ”问题 
类 似 ， 需 要 使 用 unsafe 的 代码 总 是 很 小 的 一 部 分 ， 把 这 部 分 代码 抽象 
到 独立 的 库 里 面 ， 古 比较 容易 测试 和 验证 它 的 正确 性 的 。 而 业务 逻辑 
代码 才 是 千变万化 的 ， 我 们 千 万 不 要 在 这 部 分 代码 中 用 unsafe 做 各 种 
hack。 因 此 ， 大 部 分 普通 人 束 能 充分 皇 受 到 少 部 分 精英 给 我 们 提供 的 
各 种 安全 性 保证 《编译 器 加 基础 库 ) ， 放 心 大 胆 地 做 各 种 并 行 优化 ， 


完全 不 必 担 心 会 制造 线程 安全 问题 。 


第 29 章 ”状态 共享 


前 面 我 们 已 经 看 到 ，Rust 可 以 阻止 在 多 线程 之 间 不 安全 的 共 至 状 
态 。 本 章 我 们 来 讲解 一 下 ， 在 Rust 中 ， 如 何 使 用 标准 库 安 全 地 实现 多 


线程 访问 共 译 变量 。 


29.1 Arc 


Arc 是 Rc 的 线程 安全 版 本 。 它 的 全 称 是 “Atomic reference 
counter”。 注 意 第 一 个 单词 代表 的 是 atomic 而 不 是 automatic。 它 强调 的 
是 “原子 性 *。 它 跟 Rc 最 大 的 区 别 在 于 ，3 引 用 计数 用 的 是 原子 整数 类 
型 。Arc 使 用 方法 示例 如 下 : 


use std::sync::Arc,; 
use std::thread; 


fn main() { 
let numbers: Vec< > = (0.,.100u32).collect(); 
// 引用 计数 指针 , 指向 一 个 Vec 


let Shared_numbers = Arc: :new(numbers),; 


// 循环 创建 19 个 线程 
for _ in 0..10 { 
// 复制 引用 计数 指针 , 所 有 的 Arc 都 指向 同一 个 Vec 
let child_ numbers = shared numbers.clone(); 
// move 修 饰 闭 包 , 上 面 这 个 Arc 指针 被 move 进入 了 新 线程 中 
thread::spawn(move || { 
// 我 们 可 以 在 新 线程 中 使 用 Arc, 读 取 共享 的 那个 Vec 
let local numbers = &child numbers[..]; 
// 继续 使 用 Vec 中 的 数据 
}); 
} 


} 


这 段 代码 可 以 正常 编译 通过 。 
如 果 我 们 把 上 面 代码 中 的 Arc 改 为 Re 类型， 就 会 发 生 下 面 的 编译 


错误 : 


error: the trait "std::marker::Send ”is not implemented for the type 
‘std::rc::Rc<std: :vec: :Vec<u32>>. 


因为 Rc 类 型 内 部 的 引用 计数 是 普通 整数 类 型 ， 如 果 多 个 线程 中 分 
别 同时 持 有 指 癌 同 一 块 内 存 的 Rc 指针 ， 是 线程 不 安全 的 。 这 个 错误 是 
通过 spawn 芳 数 的 签名 检查 出 来 的 。spawn 要 求 闭 包 参 数 类 型 满足 Send 
条 件 ， 闭 包 是 没有 显 式 impl Send 或 者 Sync 的 ， 按 照 auto trait 的 推理 规 
则 ， 编 译 紫 会 检查 这 个 类 型 所 有 的 成 员 是 否 满足 Send 或 者 Sync。 目 前 
这 个 财 包 参数 “捕获 "了 一 个 Rc 类 型 ， 而 Rc 类 型 是 不 满足 Send 条 件 的 ， 


因此 编译 器 推理 出 来 这 个 闭 包 关 型 是 不 满足 Send 条 件 的 ， 与 spawn 夯 
数 的 约束 条 件 发 生 了 冲突 。 


查看 源码 我 们 可 以 发 现 ，Rc 和 Arc 这 两 个 类 型 之 间 的 区 别 ， 除 了 
引用 计数 值 的 类 型 之 外 ， 主 要 如 下 : 


unsafe impl<T: ?Sized + Sync + Send> Send for Arc<T> {} 
unsafe impl<T: ?Sized + Sync + Send> Sync for Arc<T> {} 


impl<T: ?Sized> !marker::Send for Rc<T> 人 
impl<T: ?Sized> !marker::Sync for Rc<T> 1{} 


编译 絮 的 推理 过 程 为 u32 是 Send， 得 出 Unique<u32> 是 Send， 接 
着 得 出 Vec<u32> 是 Send， 然 后 得 出 Arc<Vec<u32>> 是 Send， 最 后 得 出 
闭 包 类 型 是 Send。 它 能 够 符合 Spawn 函 数 的 签名 约束 ， 可 以 罕 越 线程 
边界 。 如 果 把 共享 变量 类 型 变 成 Cell<u32> ， 那 么 Arc<Cell<u32>> 依 然 
是 不 符合 条 件 的 。 因 为 Cell 类 型 是 不 满足 Sync 的 。 


这 束 古 为 什么 有 故 气 Rust 给 用 户 提 供 了 两 种 “引用 计数 ”智能 指 
针 。 因 为 用 户 不 可 能 用 错 。 如 采 不 小 心 把 Rc 用 在 了 多 线程 环境 ， 直 接 
年 编译 错误 ， 根 本 不 会 引发 多 线程 同步 的 问题 。 如 采 不 小 心 把 Arc 用 在 
了 单线 程 环境 也 没什么 问题 ， 不 会 有 bug 出 现 ， 只 是 引用 计数 增加 或 减 
少 的 时 候 效 率 稍微 有 一 点 降低 。 


29.2 Mutex 


与 前 面 讲 解 的 Rc 类 似 ， 根 据 Rust 的 “共享 不 可 变 ， 可 变 不 共享 * 原 
则 ，Arc 有 既然 提供 了 共享 引用 ， 束 一 定 不 能 提供 可 变性 。 所 以 ，Arc 也 
是 只 读 的 ， 它 对 外 API 和 Rc 是 一 致 的 。 如 果 我 们 要 修改 怎么 办 ? 同样 
需要 “内 部 可 变性 ”。 当 然 ， 在 多 线程 环境 下 ，Cell 和 RefCell 已 经 不 能 
用 了 ， 它 们 的 内 部 实现 根本 没 考虑 过 多 线程 的 问题 ， 所 以 它们 不 满足 
Sync。 但 是 没关系 ， 反 正 即 使 不 小 心 误 用 了 ， 也 是 编译 错误 。 这 种 时 
候 ， 我 们 需要 用 线程 安全 版 本 的 “内 部 可 变性 ”， 如 Mutex 和 RwLock。 


下 面 我 们 用 一 个 示例 来 演示 一 下 Arc 和 Mutex 配 合 。 使 用 多 线程 修 
这 变 


改 共 


use std::sync::Arc,; 
use std::sync::Mutex,; 
use std::thread; 


const COUNT: U32 = 1000000 ， 


fn main() { 
let global = Arc: :new(Mutex: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in 0..COUNT { 
Jet mut value = clone1.lock().unwrap(); 
*Vvalue += 1; 
} 
}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in 0..COUNT { 
Jet mut value = clone2.1lock().unwrap(); 
*value -= 1; 


}); 
thread1.join().ok(); 


thread2.join().ok(); 
println!("final value: {:?}", global); 


为 我 们 的 闭 包 用 了 move 关 键 子 修饰 ， 为 了 避免 把 global 这 个 引 
用 计数 指针 move 进 入 闭 包 ， 所 以 在 外 面 先 提前 复制 一 份 ， 然 后 将 复制 


出 来 的 这 个 指针 传 入 财 包 中 。 这 样 两 个 线程 就 都 拥有 了 指 问 同一 个 变 
量 的 Arc 指 针 。 


在 这 个 程序 中 ， 我 们 使 用 两 个 线程 修改 同一 个 整数 : 一 个 线程 对 
它 进 行 多 次 加 1， 另 一 个 线程 对 它 进 行 多 次 减 1。 这 次 ， 我 们 使 用 Arc 来 
实现 多 线程 之 间 的 共享 ， 使 用 Mutex 来 提供 内 部 可 变性 。 每 次 需要 修 
改 的 时 候 ， 我 们 需要 调用 lock () 方法 (或 者 try_lock) 获得 锁 ， 然 后 
才能 对 内 部 的 数据 进行 读 / 写 操 作 。 因 为 锁 的 存在 ， 我 们 就 可 以 保证 整 
个 * 读 / 写 ? 是 一 个 完整 的 transaction。 对 于 Mutex 类 型 ， 标 准 库 中 有 : 


unsafe impl<T: ?Sized + Send> Send for Mutex<T> { } 
unsafe impl<T: ?Sized + Send> Sync for Mutex<T> { } 


因此 ，Arc<Mutex<isize>> 可 以 满足 Send 要 求 。 
Mutex: : lock () 方法 的 返回 类 型 是 


LockResult<MutexGuard<T>>: 


pub fn lock(&self) -> LockResult<MutexGuard<T>> 


其 中 LockResult 束 是 Result 类 型 的 一 个 别名 ， 是 用 于 错误 处 理 的 : 


type LockResult<Guard> = Result<Guard, PoisonError<Guard>>; 


如 果 当 前 Mutex 已 经 是 “有 毒 ”(Poison) 的 状态 ， 它 返回 的 就 是 错 
误 。 什 么 情况 会 导致 Mutex 有 毒 呢 ? 当 Mutex 在 锁 住 的 同时 发 生 了 
panic， 就 会 将 这 个 Mutex 置 为 有毒” 的 状态 ， 以 后 再 调用 lock () 都 会 
失败 。 这 个 设计 是 为 了 panic safety 而 考虑 的 ， 主 要 就 是 考虑 到 在 锁 住 
的 时 候 发 生 panic 可 能 导致 Mutex 内 部 数据 发 生 混乱 。 所 以 这 个 设计 防 
止 再 次 进入 Mutex 内 部 的 时 候 访 问 了 被 破坏 掉 的 数据 内 容 。 如 果 有 需 
要 的 话 ， i 依然 可 以 手动 调用 PoisonError: : into_inner () 方法 获 
得 内 部 数据 。 


而 MutexGuard 类 型 则 是 一 个 “智能 指针 ”类 型 ， 它 实现 了 DerefMut 
和 Deref 这 两 个 trait， 所 以 它 可 以 被 当 人 问 人 的 普通 指针 使 
用 。MnutexGuard 实 现 了 一 个 析 构 函数 ， 通 过 RAII 手 法 ， 在 析 构 函数 中 


() 方法 解锁 。 因 此 ， 用 户 是 不 需要 手动 调用 方法 解锁 


Mutex 


(Interial mutability) 


Rnust 的 这 个 设计 ， 优 点 不 在 于 它 “ 人 允许 你 做 什么 ”， 而 在 于 它 “ 不 允 
许 你 做 什么 ” 。 如 果 我 们 误 用 了 Rec<isize> 来 实现 线程 之 间 的 共享， 驶 
是 编译 错误 。 . 根据 编译 错误 ， 我 们 将 指针 改 为 Arc 类 型 ， 然 后 又 会 发 
现 ， 它 根本 没有 提供 可 变性 。 它 的 API 只 能 共享 读 ， 根 本 没有 写 数 据 
的 方法 存在 。 此 时 ， 我 们 会 想到 加 入 内 部 可 变性 来 允许 多 线程 共 tk 享 读 
写 。 如 果 我 们 使 用 了 Arc<RefCell< >> 类型， 依然 是 编译 错误 。 因 为 
RefCell 类 型 不 满足 Sync。 而 Arc<T> 需 要 内 部 的 T 参 数 必须 满足 T: 
Sync， 才 能 使 Arc 满 足 Sync。 把 这 些 综合 起 来 ， 我 们 可 以 推理 出 


Arc<RefCell< >> 是 ! Sync。 


最 终 ， 编 译 器 把 其 他 的 路 都 堵 死 了 ， 唯 一 可 以 编译 通过 的 驶 是 使 
用 那 芋 泣 足 Sync 条 件 的 类 型 ， 比 如 Arc<Mnutex<_>>。 在 使 用 的 时 候 ， 
我 们 也 不 可 能 起 记 调 用 lock 方 法 ， 因 为 Mutex 把 真实 数据 包 正 起 来 了 ， 
只 有 调用 lock 方 法 才 有 机 会 访问 内 部 数据 。 我 们 也 不 需要 记得 调用 
unlock 方 法 ， 因 为 lock 方 法 返回 的 是 一 个 MutexGuard 类 型 ， 这 个 类 型 
在 析 构 的 时 候 会 目 动 调 用 unlock。 


所 以 ， 编 译 紫 在 瘟 着 用 户 用 正确 的 方式 写 代 码 。 


29.3 RwLock 


RwLock 束 古 “ 读 写 锁 *。 它 跟 Mutex 很 像 ， 主 要 区 别 是 对 外 雄 露 的 
API 不 一 样 。 对 Mutex 内 部 的 数据 读 写 ，RwLock 都 是 调用 同样 的 lock 方 
法 ;而 对 RwLock 内 部 的 数据 读 写 ， 它 分 别提 供 了 一 个 成 员 方法 
read/write 来 做 这 个 事情 。 其 他 方面 基本 和 Mautex 一 致 。 示 例如 下 : 


use std::sync::Arc; 
use std::sync::RwLock; 
use std::thread; 


const COUNT: U32 = 1000000 ， 


fn main() { 
let global = Arc: :new(RwLock: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in 0..COUNT { 
let mut value = clone1.write().unwrap(); 
*Vvalue += 1; 


}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in 0..COUNT { 
let mut value = clone2.write().unwrap(); 
*Vvalue -= 1; 


}); 
thread1.join().ok(); 


thread2.join().ok(); 
println!("final value: {:?}", global); 


29.4 Atomilc 


Rust 标 准 库 还 为 我 们 提供 了 一 系列 的 “原子 操作 ”数据 类 型 ， 它 们 
在 std: : sync: : atomic 模 块 里 面 。 它 们 都 是 符合 Sync 的 ， 可 以 在 多 
线程 之 间 共 享 。 比 如 ， 我 们 有 AtomicIsize 类 型 ， 顾 名 思 义 ， 它 对 应 的 
是 isize 类 型 的 “线程 安全 ”版 本 。 我 们 知道 ， 普 通 的 整数 读 取 再 写 入 ， 
这 种 操作 是 非 原 子 的 。 “而 原子 整数 的 特点 二， 可 以 把 “ 恋 取 “计算 ”再 
写 入 ”这 样 的 操作 编译 为 特殊 的 CPU 指 令 ， 保 证 这 个 过 程 是 原子 操作 。 


我 们 来 看 一 个 示例 : 


use std::sync::Arc; 
use std::sync::atomic::{AtomicIsize, Ordering}; 
use std::thread; 


const COUNT: U32 = 1000000 ; 

fn main() { 
// Atomic 系列 类 型 同样 提供 了 线程 安全 版 本 的 内 部 可 变性 
let global = Arc::new(AtomicIsize: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in 0..COUNT { 
clonei1.fetch_add(1, Ordering::SeqCst); 
} 


}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in 0..COUNT { 
clone2.fetch_sub(1, Ordering::SeqCst); 
} 


}); 


thread1.join().ok(); 
thread2.join().ok(); 
println!("final value: {:?}", global); 


这 个 示例 我 们 很 熟悉 ， 两 个 线程 修改 同一 个 整数 ， 一 个 线程 对 它 
进行 多 次 加 1， 另 外 一 个 线程 对 它 多 次 减 1。 这 次 我 们 发 现 ， 使 用 了 
Atomic 类 型 后 ， 我 们 可 以 保证 最 后 的 执行 结果 一 定 会 回 到 0 。 


我 们 还 可 以 把 这 段 代 码 改 动 一 下 : 


use std::sync::Arc; 
use std::sync::atomic::{AtomicIsize, Ordering}; 
use std::thread; 


const COUNT: U32 = 1000000 ， 


fn main() { 
let global = Arc::new(AtomicIsize: :new(0)); 


let clone1 = global.clone(); 
let thread1 = thread::spawn(move|| { 
for _ in 0..COUNT { 
let mut value = clone1.load(Ordering::SeqCst); 
Value += 1; 
clonei1.store(value, Ordering::SeqCst); 
} 
}); 


let clone2 = global.clone(); 
let thread2 = thread::spawn(move|| { 
for _ in 0..COUNT { 
let mut value = clone2.load(Ordering::SeqCst); 
Value -= 1; 
clone2.store(value, Ordering::SeqCst); 


}); 


thread1.join().ok(); 
thread2.join().ok(); 
println!("final value: {:?}", global); 


与 上 一 个 版 本 相 比 ， 这 上 段 代 码 的 区 别 在 于 : 我 们 没有 使 用 原子 类 
型 自己 提供 的 fetch_add fetch_sub 方 法 ， 而 是 使 用 了 load 把 里 面 的 值 读 
取出 来 ， 然 后 执行 加 / 减 ， 操 作 完 成 后 ， 再 用 store 存 储 回 去 。 编 译 程序 
我 们 看 到 ， 是 可 以 编译 通过 的 。 再 执行 ， 出 现 了 问题 : 这 次 的 执行 结 
果 就 不 是 保证 为 0 了 。 


大 家 应 该 很 容易 看 明日 问题 在 哪里 。 原 来 的 那 种 写法 ,“ 读 取 / 计 
算 / 写 入 "是 一 个 完整 的 “原子 操作 >， 中 间 不 可 被 打 断 ， 它 是 一 个 “ 事 
务 ” (transaction) 。 而 后 面 的 写法 把 “ 读 取 ”作为 了 一 个 “原子 操 
作 ”,“ 写 入 ”又 作为 了 一 个 “原子 操作 >， 把 一 个 transaction 分 成 了 两 段 
来 执行 。 上 面 的 那个 程序 ， 其 逻辑 类 似 于 “lock=> 读 数据 = > 加 / 减 运 云 算 
=> 写 数据 =>unlock”。 下面 的 程序 ， 其 逻辑 类 似 于 “lock=> 读 数据 
=>unlock=> 加 / 减 运 算 =>lock= > 写 数 据 = >unlock”。 虽 然 每 次 读 写 共 享 变 
量 都 保证 了 唯一 性 ， 但 逻辑 还 是 错 的 。 


所 以 ， 编 译 右 只 能 防止 基本 的 数据 苋 争 问题 。 如 果 程 序 里 面 有 过 
辑 错误 ， 工 具 是 没有 办 法 帮 我 们 发 现 的 。 上面 这 个 示例 中 并 不 存在 数 
据 范 搜 问 题 ， 是 完全 的 “业务 逻辑 bug”。 


29.5“ 死 锁 


既然 Rust 中 提供 了 “ 锁 ? 机 制 ， 那 么 Rust 中 是 否 有 可 能 出 现 * 死 锁 ” 的 
现象 呢 ? 我 们 用 经 典 的 “哲学 家 忠和 餐 问 题 "来 演示 一 下 。 


问题 : 假设 有 5 个 哲学 家 ， 共 主 一 张 放 有 5 把 椅子 的 朱子 ， 每 人 分 
得 一 把 棕 子 ， 但 是 ， 昌 子 上 共有 5 文 策 子 ， 在 每 人 两 边 各 放 一 支 哲学 
家 们 在 肚子 饥 狐 时 才 试 图 分 两 次 从 两 边 拿 起 合子 就 餐 。 

条 件 : 

' 拿 到 两 文 筑 子 时 哲学 家 才 开始 叶 饭 ; 


"0 则 该 哲学 家 必须 等 他 人 吃 完 之 后 才能 拿 
| 筷子 ; 


' 任 一 哲学 家 在 目 己 未 拿 到 两 只 筷子 前 却 不 放下 目 己 手 中 的 筷子 。 
代码 如 下 : 


use std::thread; 
use std::sync::{Mutex, Arc}; 
use std::time::Duration; 


struct Philosopher { 
name: String, 
left: usize, 
right: usize, 


impl Philosopher { 
fn new(name: &str, left: usize, right: usize) -> Philosopher { 
Philosopher { 
name: name.to_string(), 
left: left, 
right: right, 


} 


fn eat(&self, table: &Table) { 
let _left = table.forks[self.1left].1lock().unwrap(); 
println!("{} take left fork.", self.name); 
thread: :sleep(Duration::from_ secs(2)); 
let _right = table.forks[self.right].1lock().unwrap(); 


println!("{} take right fork.", self.name),; 
thread: :sleep(Duration::from_ secs(1)); 
println!("{} is done eating.", self.name); 
} 
} 


struct Table { 
forks: Vec<Mutex<()>>, 
} 


fn main() { 
let table = Arc::new(Table { forks: vecl[ 
Mutex: :new(()), 
Mutex: :new(()), 
Mutex: :new( ( 
Mutex: :new(( 
Mutex: :new( ( 


]}); 


let philosophers = veci![ 
Philosopher::new("Judith Butler", 0, 1), 
Philosopher: :new("Gilles Deleuze", 1, 2), 
Philosopher::new("Karl Marx", 2, 3), 
Philosopher::new("Emma Goldman", 3, 4), 
Philosopher::new("Michel] Foucault", 4, 0), 


]; 


let handles: Vec< > = philosophers.into_ iter().map(|p| { 
let table = table.clone(); 


thread::spawn(move || { 
p.eat(&table); 


}) 

}).collect(); 

for h in handles { 
h.join().unwrap(); 


编译 执行 ， 我 们 可 以 发 现 ，5 个 哲学 家 都 拿 到 了 他 左边 的 那 文秘 
子 ， 而 都 在 等 待 他 右边 的 那 文 饥 子 。 在 没 等 到 右边 筷子 的 时 候 ， 每 个 
人 都 不 会 释放 目 己 已 经 拿 到 的 那 文 和 包子 。 于 是 ， 大 家 都 进入 了 无 限 的 
等 待 之 中 ， 程 序 无 法 继续 执行 了 。 这 束 古 “ 死 锁 ”。 


在 Rust 中 , “ 死 够 "问题 是 没有 办 法 在 编译 阶段 由 静态 检查 来 解决 
的 。 束 像 前 面 提 到 的 “循环 引用 制造 内 存 泄漏 一样， 编译 万 无 法 通过 
静态 检查 来 完全 避免 这 个 问题 ， 需 要 程序 员 目 己 注 意 。 


29.0 Barrier 


除了 “ 锁 ” 之 外 ，Rust 标 准 库 还 提供 了 一 些 其 他 线程 之 间 的 通信 方 
式 ， 比 如 Barrier 等 。Barrier 是 这 样 的 一 个 类 型 ， 它 使 用 一 个 整数 做 初 
人 然后 再 继续 执行 。 示 
列 如 下 : 


use std::sync::{Arc, Barrier}; 
use std::thread; 


fn main() { 
let barrier = Arc::new(Barrier: :new(10)); 
let mut handlers = vec![]; 
for _ in 0..10 { 
let c = barrier.clone(); 
// The same messages will be printed together. 
// You will NOT see any interleaving. 
let t = thread::spawn(move|| { 
println!("before wait"),; 
c.wait(); 
println!("after wait"); 


}); 
handlers .push(t); 
} 


for h in handlers { 
h.join().ok(); 
} 


} 


这 个 程序 创建 了 一 个 多 个 线程 之 间 共 享 的 Barrier， 它 的 初始 值 是 
10。 我 们 创建 了 10 个 子 线程 ， 每 个 子 线程 都 有 一 个 Arc 指 针 指 向 了 这 个 
Barrier， 并 在 子 线程 中 调用 了 Barrier : wait 方 法 。 这 些 子 线程 执行 到 
wait 方 法 的 时 候 ， 就 开始 进入 等 待 状态 ， 一 直到 wait 方 法 被 调用 了 10 
次 ，10 个 子 线程 都 进入 等 待 状态 ， 此 时 Barrier 就 通知 这 些 线程 可 以 继 
续 了 。 然 后 它们 再 开始 执行 下 面 的 逻辑 。 


所 以 最 终 的 执行 结果 是 : 先 打 印 出 10 条 before wait， 再 打印 出 10 条 
after wait， 绝 不 会 错乱 。 如 果 我 们 把 c.wait () 这 条 语句 删除 掉 可 以 看 
到 ， 执 行 结果 中 ，before wait 和 after wait 是 混杂 在 一 起 的 。 


29.7 Condvar 


Condvar 是 条 件 变 量 ， 它 可 以 用 于 等 待 某 个 事件 的 发 生 。 在 等 竺 的 
时 候 ， 这 个 线程 处 于 阻塞 状态 ， 并 不 消耗 CPU 资源 。 在 常见 的 操作 系 
统 上 ，Condvar 的 内 部 实现 是 调用 的 操作 系统 提供 的 条 件 变 量 。 它 调用 
wait 方 法 的 时 候 需 要 一 个 MutexGuard 类 型 的 参数 ， 因 此 Condvar 总 是 与 
Mutex 配 合 使 用 的 。 而 且 我 们 一 定 要 注意 ， 一 个 Condvar 应 该 总 是 对 应 
一 个 Mutex， 不 可 混用 ， 否 则 会 导致 执行 阶段 的 panic 。 


Condvar 的 一 个 常见 使 用 模式 是 和 一 个 Mutex<bool> 类 型 结合 使 
用 。 我 们 可 以 用 Mutex 中 的 bool 变 量 存储 一 个 旧 的 状态 ， 在 条 件 发 生 改 
变 的 时 候 修 改 它 的 状态 。 通 过 这 个 状态 值 ， 我 们 可 以 决定 是 否 需 要 执 
行 等 每 事件 的 操作 。 示 例如 下 : 


use std::sync::{Arc, Mutex, Condvar}; 

use std::thread; 

use std::time::Duration; 

fn main() { 
let pair = Arc::new((Mutex: :new(false), Condvar: :new())); 
let pair2 = pair.clone(); 


thread::spawn(move|| { 
thread: :sleep(Duration::from_ secs(1)); 
let &(ref lock, ref cvar) = &*pair2,; 
let mut started = lock.lock().unwrap(); 
*started = true; 
cvar .notify_one(); 
println!("child thread {}", *started); 
}); 


// wait for the thread to start up 
let &(ref lock, ref cvar) = &*pair; 
Jet mut started = lock.lock().unwrap(); 


println!("before wait {}", *started); 
while !*started { 
started = cvar.wait(started).unwrap(); 


} 
println!("after wait {}", *started); 


这 上 段 代 码 中 存在 两 个 线程 之 间 的 共 译 变量 ， 包 括 一 个 Condvar 和 一 
个 Mutex 封 装 起 来 的 bool 类 型 。 我 们 用 Arc 类 型 把 它们 包 起 来 。 在 和子 线 


程 中 ， 我 们 做 完了 某 件 工作 之 后 ， 束 将 共享 的 bool 类 型 变量 设置 为 
true， 并 使 用 Condvar: : notify_one 通 知事 件 发 生 。 


在 主线 程 中 ， 我 们 首先 判定 这 个 bool 变 量 是 否 为 rue: 如 果 已 经 是 
tue， 那 就 没 必要 进入 等 待 状态 了 ， 否 则 ， 就 进入 阻塞 状态 ， 等 待 子 
线程 完成 任务 。 


29.8 全 局 变量 


Rust 中 允许 存在 全 局 变量 。 在 基本 语法 章节 讲 过 ， 使 用 static 关 键 
字 修 饰 的 变量 束 是 全 局 变量 。 全 局 变量 有 一 个 特点 : 如果 要 修改 全 局 
变量 ， 必 须 使 用 unsafe 关 键 字 : 


static mut G: i32 = 1; 


fn main() { 
G = 2; 
} 


编译 ， 可 见 错误 信息 为 : 


error[E0133]: use of mutable static requires unsafe function or block 


这 个 规定 显然 是 有 助 于 线程 安全 的 。 如 采 人 允许 任何 函数 可 以 随便 
读 写 全 局 变量 的 话 ， 线 程 安全 就 无 从 谈 起 了 。 只 有 不 用 mut 修 饰 的 全 
局 变量 才 是 安全 的 ， 因 为 它 只 能 被 读 取 ， 不 能 被 修改 。 


我 们 又 可 以 想到 ， 有 些 类 型 的 变量 不 用 mnut 修 也， 也 是 可 以 做 修 
改 的 。 比 如 具备 内 部 可 变性 的 Cell 等 类 型 。 我 们 可 以 试验 一 下 ， 如 采 
有 一 个 全 局 的 、 具 备 内 部 可 变性 的 变量 ， 会 发 生 什么 情况 : 


#![feature(const_fn)] 
use std::cell::Cell; 
use std::thread; 


static G: Cell<i32> = Cell::new(1); 


fn f1() { 
G.set(2); 


fn f2() { 
G.set(3); 


fn main() { 
thread::spawn( || { f1() } ); 
thread::spawn( || { f2() } ); 
} 


试 着 编译 一 下 上 面 这 个 例子 ， 可 见 编译 错误 为 : 


error[E0277]: the trait bound ‘std::cell::Cell<i32>: std::marker::Sync is not 
satisfied 
--> test.rs:5:1 


5 | static G: Cell<i32> = Cell::new(1); 
和 人 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 人 人 “std:':cell':':Cell<i32>. cannot be shared 
between threads safely 


= help: the trait ‘std::marker::Sync. is not implemented for “std::cell:: 
Cell<i32>. 
= note: shared static variables must have a type that implements “Sync 


对 于 上 面 这 个 例子 ， 我 们 可 以 推理 一 下 ， 现 在 有 两 个 线程 同时 修 
改 一 个 全 局 变量 ， 而 且 修 改过 程 没 有 做 任何 线程 同步 ， 这 里 肯定 是 有 
线程 安全 的 问题 。 但 征 ， 注 意 这 里 传递 给 spawn 函 数 的 半 包 ， 实 际 上 
没有 捕获 任何 局 部 变量 ， 所 以 ， 它 是 满足 Send 条 件 的 。 在 这 种 情况 
下 ， 线 程 不 安全 类 型 并 没有 直接 守 越 线 得 的 力 界 ，spawn 函 数 这 里 指 
定 的 约束 条 件 是 查 不 出 问题 来 的 。 


但 是 ， 编 译 妖 还 设置 了 男 外 一 条 规则 ， 即 共享 义 可 变 的 全 局 变 
必须 满足 Sync 约束 。 根 据 Sync 的 定义 ， 满 足 这 个 条 件 的 全 局 变 外 从 
0 的 。 因 此 ， 编 译 紫 把 这 条 路 也 墙 死 了 ， 我 们 不 可 以 位 单 地 

全 局 变量 共享 状态 来 构造 出 线程 不 安全 的 行为 。 对 于 那些 满足 
比如 Atomic 系 列 类 型 ， 作 为 全 局 


nc 条 
变量 共事 全 且 合 法 的 。 


29.9 ”线程 局 部 存储 


线程 局 部 (Thread Local) 的 意思 是 ， 声 明 的 这 个 变量 看 起 来 是 


个 变量 ， 但 它 实际 上 在 每 一 个 线程 中 分 别 有 目 己 独 立 的 存储 地 址 ， 是 
不 同 的 变量 ， 互 不 干扰 。 在 不 同 线程 中 ， 只 能 看 到 与 当前 线程 相关 联 
的 那个 副本 ， 因 此 对 它 的 读 写 无 须 考虑 线程 安全 问题 。 


在 Rust 中 ， 线 程 独立 存储 有 两 种 使 用 方式 。 


:可 以 使 用 #[thread_local]jattribute 来 实现 。 这 个 功能 目前 在 稳定 版 
中 还 不 支持 ， 只 能 在 nightly 版 本 中 开启 #! [feature (thread_local) ] 功 
能 才能 使 用 。 


可 以 使 用 thread_local ! 宏 来 实现 。 这 个 功能 已 经 在 稳定 版 中 获得 
EE 


示例 如 下 : 


use std::cell::RefCell; 
Use std::thread; 


fn main() { 


thread_locallf{ 
static FOO: RefCell<u32> = RefCell: :new(1) 
}; 


FOO.with(|f| { 
println!("main thread valuel1 {:?}", *f.borrow()); 
*f,borrow mut() = 2; 
println!("main thread value2 {:?}" 


}); 


,， *f.borrow()); 


let t = thread::spawn(move|| { 
FOO.with(|f| { 
println!("child thread valuel1 {:?}", *f.borrow()); 
*f,borrow_ mut() = 3; 
println!("child thread value2 {:?}", *f.borrow()); 
}); 


}); 
t.join().ok(); 


FOO.with(|f| { 
println!("main thread value3 {:?}", *f.borrow()); 


}); 


用 thread local! 声明 的 变量 ， 使 用 的 时 候 要 用 with () 方法 加 闭 
包 来 完成 。 以 上 代码 编译 、 技 行 的 结果 为 ; 


main thread valuel 1 
main thread Value2 2 
child thread value1 1 
child thread value2 3 
main thread value3 2 


我 们 可 以 看 到 ， 在 主线 程 中 将 FOO 的 值 修改 为 2， 但 是 进入 子 线程 
后 ， 它 看 到 的 初始 值 依然 征 1。 在 子 线程 将 FOO 的 值 修改 为 3 之 后 回 到 
主线 程 ， 主 线程 看 到 的 值 还 是 2 。 


这 说 明 ， 在 子 线程 中 和 主线 程 中 看 到 的 FOO 其 实 是 两 个 完全 独立 
的 变量 ， 互 不 影响 。 


29.10 “总结 


分 太 可 见 ， Rust 的 设计 一 方面 禁止 了 我 们 在 线程 之 间 随 
意 共享 变量 ， 男 一 方面 提供 了 一 些 工具 类 型 供 我 们 使 用 ， 使 我 们 可 以 
安全 地 在 绑 祁 之 问 估 学 变量 。 这 既 提 供 了 完整 的 功能 ， 又 避免 了 数据 
竞争 一 类 的 bug。Rnust 之 所 以 这 么 设计 ， 有 是 因为 设计 者 观察 到 了 发 
生 “数据 竞 争 ” 的 根源 是 什么 。 人 稍 单 总 结 融 是 : 


Alias+ Mutation+No ordering 


实际 上 我 们 可 以 看 到 ，Rust 保 证 内 存 安全 的 是 路 和 线程 立 全 站 二 
9 。 在 多 线程 中 ， 我 们 要 保证 没有 数据 竞争 ， 一 般 是 通过 下 
， 工 N 


(1) 多 个 线程 可 以 同时 读 共享 变量 ， 
(2) 只 要 存在 一 个 线程 在 写 共享 变量 ， 则 不 允许 其 他 线程 读 / 写 
共享 变量 。 


这 是 不 是 与 第 二 部 分 讲 的 “内 存 安全 ”的 模型 一 模 一 样 ? 这 两 个 设 
计 实 际 上 是 一 脉 相 承 的 。 如 果 没 有 “默认 内 存 安全 ”打下 的 良好 基础 ， 
Rust 就 没 办 法 做 到 “线程 安全 ”， 正 因为 在 “内 存 安全 ”问题 上 的 一 系列 
基础 性 设计 ， 才 导致 了 “线程 安全 ”基本 就 是 水 到 渠 成 的 结果 。 我 们 其 
至 可 以 观察 到 一 些 “ 线 程 安全 类 型 ”和 * 非 线程 安全 类 型 > 之 间 有 趣 的 对 
应 关系 ， 比 如 : 


(1) Rc 是 非 线程 安全 的 ，Arc 则 是 与 它 对 应 的 线程 安全 版 本 。 当 
然 还 有 弱 指 针 Weak 也 是 一 一 对 应 的 。Rc 无 须 考 虑 多 线程 场景 下 的 问 
题 ， 因 此 它 内 部 只 需 普 通 整数 做 引用 计数 即 可 。Arc 要 用 在 多 线程 场 
景 ， 因 此 它 内 部 必须 使 用 “原子 整数 ”来 做 引用 计数 。 


(2) RefCell 是 非 线 程 安全 的 ， 它 不 能 在 跨 线程 场景 使 用 。 
Mnutex/RwLock 则 是 与 它 相 对 应 的 线程 安全 版 本 。 它 们 都 提供 了 “内 部 
可 变性 ”，RefCell 无 须 考 虑 多 线程 问题 ， 所 以 它 内 部 只 需 一 个 普通 整 
数 做 借用 计数 即 可 。Mutex/RwLock 可 以 用 在 多 线程 环境 ， 所 以 它们 内 
部 需要 使 用 操作 系统 提供 的 原 语 来 完成 “ 锁 ” 功 能 。 它 们 有 相似 之 处 ， 


也 有 不 同 之 处 。 Mutex/RwLock 在 加 锁 的 时 候 返 回 的 是 Result 类 型 ， 是 
因为 它们 需要 考虑 < 异常 安全 ”问题 在 多 线程 环境 下 ， 很 可 能 出 现 
一 个 线程 发 生 了 panic， 导 致 Mutex 内 部 的 数据 已 经 被 人 破坏， 而 在 另外 
一 个 线程 中 依然 有 可 能 观察 到 这 个 被 破坏 的 数据 结构 。RefCell 则 相对 
简单 ， 只 需 考虑 AssertUnwindSafe 即 可 。 


(3) Cell 是 非 线 程 安全 的 ，Atomic* 系 列 类 型 则 是 与 它 对 应 的 线 
程 安全 版 本 。 它 们 之 间 的 相似 之 处 在 于 ， 都 提供 了 “内 部 可 变性 ”， 而 
且 都 不 提供 指向 内 部 数据 的 方法 。 它 们 对 内 部 数据 的 读 写 ， 都 是 整体 
读 出 、 整 体 写 入 ， 不 可 能 制造 出 直接 指向 内 部 数据 的 指针 。 它 们 的 不 
同 之 处 在 于 ，Cell 的 条 件 更 宽松 。 而 标准 库 提供 的 Atomic* 系 列 类 型 则 
受 限 于 CPU 提 供 的 原子 指令 ， 内 部 存储 的 数据 类 型 是 有 限 的 ， 无 法 推 
广 到 所 有 类 型 。 其 实 我 们 完全 可 以 仿造 Cell 类 型 ， 设 计 一 个 可 以 应 用 
于 所 有 类 型 的 通用 型 Atomic<T> 类 型 内 部 用 Mutex 实 现 ， 提 供 
get/set 方 法 作为 对 外 API。 这 个 党 斌 已 经 在 第 三 方 开源 库 中 实现 ， 如 需 
了 解 ， 上 GitHub 搜 索 “atomic-rs” 即 可 。 


Rust 的 这 套 线程 安全 设计 有 以 下 好 处 : 
:免疫 一 切 数 据 竞 搜 ; 

-无 额外 性 能 损耗 ; 
-无须 与 编译 升 紧 耦合 。 


我 们 可 以 观察 到 一 个 有 趣 的 现象 : Rust 语 言 实际 上 并 不 知晓 “ 线 

程 ”这 个 概念 ， 相 关 类 型 都 是 写 在 标准 库 中 的 ， 与 其 他 类 型 并 无 二 致 。 
Rnust 语 言 提供 的 仅仅 只 是 Sync、Send 这 样 的 一 般 性 概念 ， 以 及 生命 周 
期 分 析 、“borrow check" 分 析 这 样 的 机 制 。Rust 编 译 吉 本身 并 未 与 “ 线 
程 安 全 ”数据 竞争 "等 概念 深度 绑 定 ， 也 不 需要 一 个 runtime 来 辅助 完成 
功能 。 然 而 ， 通 过 这 些 基 本 概念 和 机 制 ， 它 却 实现 了 完全 通过 编译 阶 
0 目标 。 这 样 的 设计 正 是 Rust 的 
乍 。 


正 因为 解 籼 合 如 此 彻 故 ，Rust 语 言 才 会 如 此 精简 ， 它 只 提供 了 非 
党 基本 的 并 行 开发 相关 的 基本 抽象 。 而 且 标 准 库 中 实现 的 这 些 基 本 功 
能 ， 其 实 都 可 以 完全 由 第 三 方 来 实现 。 理 论 上 来 讲 ， 其 他 语言 中 出 现 
了 的 更 高 级 的 并 行程 序 开发 的 抽象 机 制 ， 一 般 都 可 以 通过 第 三 方 库 的 


方式 来 提供 ， 没 必要 与 Rust 编 译 需 深度 绑 定 。 在 下 一 章 中， 我们 再 来 
介绍 一 些 更 高 级 的 并 行 开 发 模式 ， 它 们 都 由 第 三 方 库 来 实现 ， 无 须 纺 
译 占 特殊 支持 。 


第 30 章 ”管道 


在 上 一 章 中 ， 我 们 主要 讲述 了 如 何在 多 线程 中 共享 变量 。Rust 标 
准 库 中 还 提供 了 另外 一 种 线程 之 间 的 通信 方式 : mpsc。 这 部 分 的 库存 
储 在 std: : sync: : mpsc 这 个 模块 中 。mpsc 代 表 的 是 Multi-producer， 
single-consumer FIFO queue， 即 多 生产 者 单 消费 者 驳 进 先 出 队列 。 这 
种 线程 之 间 的 通信 方式 是 在 不 同 线程 之 间 建 立 一 个 通信 “ 管 


道 ”(channel) ,一边 发 送 消息 ， 一 边 接收 消息 ， 完 成 信息 交流 。 


Do not communicate by sharing memory; instead, share memory by 
communicating. 
一 一 Effective Go 


既然 共 吾 数据 存在 很 多 麻烦 ， 那 在 某 些 场景 下 ， 用 发 消息 的 方式 
完成 线程 之 间 的 通信 是 更 合适 的 选择 。 


30.1 异步 管道 


异步 管道 古 最 第 用 的 一 种 管道 类 型 。 它 的 特点 十: 发 送 端 和 接收 
端 之 间 存 在 一 个 缓 神 区 ， 发 送 端 发 送 数据 的 时 候 ， 有 是 先 将 这 个 数据 扔 
到 缓冲 区 ， 再 由 接收 器 目 己 去 取 。 因 此 ， 每 次 发 送 ， 了 立马 就 返回 了 ， 
发 送 端 不 用 管 数据 什么 时 候 被 接收 端 处 理 。 


我 们 移 用 一 个 简单 示例 来 演示 一 下 管道 的 基本 用 法 : 


use std::thread; 
use std::sync::mpsc::channel; 
fn main() { 
let (tx, rx) = channel(); 
thread::spawn(move|| { 
for i in 0. 
tx. send (i). unwrap( ); 


}); 


while let Ok(r) = = rx. recv() { 
println!("received {}", r 


在 这 个 示例 中 ， 我 们 首先 创建 了 一 个 管道 。channel 函 数 的 签名 是 
这 样 的 : 


pub fn channel<T>() -> (Sender<T>, Receiver<T>) 


它 返 回 了 一 个 tuple， 里 面包 括 一 个 发 送 者 (Sender) 和 一 个 接收 
者 (Receiver) 


PA 然后 将 这 个 发 送 者 move 进 入 了 了 于 线 


子 线程 中 的 发 送 者 不 断 循 环 调用 send 方 法 ， 发 送 数 据 。 在 主线 程 
中 ， 我 们 使 用 接收 者 不 断 调用 recv 方 法 接收 数据 。 


我 们 可 以 注意 到 ，channel () 是 一 个 泛 型 本 数 ，Sender 和 Receiver 
都 是 泛 型 类 型 ， 且 一 组 发 送 者 和 接收 者 必定 是 同样 的 类 型 参数 ， 因 此 
保证 了 发 送 和 接收 端 都 是 同样 的 类 型 。 因 为 Rust 中 的 类 型 推导 功能 的 
存在 ， 使 我 们 可 以 在 调用 channel 的 时 候 不 指定 具体 类 型 参数 ， 而 通过 
后 续 的 方法 调用 ， 推 导出 正确 的 类 型 参数 。 


Sender 和 Receiver 的 泛 型 参数 必须 满足 T: Send 约 束 。 这 个 条 件 是 
显而易见 的 : 被 发 送 的 消息 会 从 一 个 线程 转移 到 另外 一 个 线程 ， 这 个 
约束 是 为 了 满足 线程 安全 。 如 果 用 户 指 定 的 泛 型 参数 没有 满足 条 件 ， 
在 编译 的 时 候 会 发 生 错误 ， 提 醒 我 们 修复 bug。 


发 送 者 调用 send 方 法 ， 接 收 者 调用 recv 方 法 ， 返 回 类 型 都 是 Result 
类 型 ， 用 于 错误 处 理 ， 因 为 它们 都 有 可 能 调用 失败 。 当 发 送 者 已 经 被 
销毁 的 时 候 ， 接 收 者 调用 recv 则 会 返回 错误 ; 同样 ， 当 接收 者 已 经 销 
毁 的 时 候 ， 发 送 者 调用 send 也 会 返回 错误 。 


在 管道 的 接收 端 ， 如 采 调 用 recv 方 法 的 时 候 还 没有 数据 ， 它 会 进 
入 等 行 状 态 阻 塞 当 前 线程 ， 直 到 接收 到 数据 才 继 续 往 下 执行 。 


管道 还 可 以 是 多 发 送 端 单 接收 端 。 做 法 很 帘 单 ， 只 需 将 发 送 端 
Sender 复 制 多 份 即 可 。 复 制 方式 是 调用 Sender 类 型 的 clone () 方法 。 
这 个 库 不 支持 多 接收 端的 设计 ， 因 此 Receiver 类 型 没有 clone () 方 
法 。 在 上 例 的 基础 上 我 们 稍 做 改动 ， 创 建 多 个 线程 ， 每 个 线程 发 送 一 
个 数据 到 接收 端 。 代 码 如 下 : 


use std::thread; 
use std::sync::mpsc::channel; 


fn main() { 
let (tx, rx) = channel(); 


for i in 0..10 { 
let tx = tx.clone(); // 复制 一 个 新 的 tx, 将 这 个 复制 的 变量 move 进入 子 线 程 
thread::spawn(move|| { 
tx.send(i).unwrap(); 


}); 


} 
drop(tx); 


while let Ok(r) = rx.recv() { 
println!("received {}", r); 


以 上 代码 编译 执行 ， 可 以 发 现 它 打印 的 结果 与 前 面 的 例子 不 同 


。 在 前 面 示例 中 ， 这 些 数 字 呈 顺序 排列 ， 因 为 发 送 端 是 按 顺 序 发 送 
， 授 收 问 会 保持 同样 的 顺序 。 但 在 这 个 示例 中 ， 这 些 数字 呈 乱 序 排 
， 因 为 它们 来 目 不 同 的 线程 ， 哪 个 先 执行 哪个 后 执行 并 不 是 确定 
， 取 决 于 操作 系统 的 调度 。 


目前 我 们 用 的 这 个 管道 十 “异步 ”的 标准 库 还 提供 了 男 外 一 种 “ 同 


;管道 供 我 们 使 用 。 同 步 管道 和 异步 管道 在 接收 端 是 一 样 的 逻辑 ， 区 


别 在 于 发 送 端 。 


30.2 ”同步 管道 


异步 管道 内 部 有 一 个 不 限 长 度 的 缓冲 区 ， 可 以 一 直 往 里 面 填充 数 
据 ， 直 至 内 存 资 源 耗 尽 。 异 步 管道 的 发 送 闻 调 用 send 方 法 不 会 发 生 阻 
塞 ， 只 要 把 消息 加 入 到 缓冲 区 ， 它 就 马上 返回 。 


同步 管道 的 特点 是 : 其 内 部 有 一 个 固定 大 小 的 缓冲 区 ， 用 来 缓存 
消 妃 。 如 果 缓 冲 区 被 填 满 了 ， 继 续 调用 send 方 法 的 时 候 会 发 生 阻 塞 ， 
等 竺 接收 端 把 缓 钟 区 内 的 消 轧 拿 走 才能 继续 发 送 。 缓 种 区 的 长 度 可 以 
在 建立 管道 的 时 候 设置 ， 而 且 0 是 有 效 数 值 。 如 采 缓 冲 区 的 长 度 设 置 为 
0， 那 束 意 味 着 每 次 的 发 送 操作 都 会 进入 等 得 状态 ， 直 到 这 个 消 乱 被 接 
收 端 取 走 才能 返回 。 示 例如 下 : 


use std::thread; 
use std::sync::mpsc::sync_channel,; 


fn main() { 
let (tx, rx) = sync_channel(1); 
tx.send(1).unwrap(); 
println!("send first"); 
thread::spawn(move|| { 
tx.send(2).unwrap(); 
println!("send second"); 


}); 


println!("receive first {}", rx.recv().unwrap()); 
println!("receive Second {}", rx.recv().unwrap()); 


我 们 可 以 看 到 ， 程 序 执行 结果 永远 是 : 发 送 一 个 并 接收 一 个 之 
后 ， 才 会 出 现 发 送 第 二 个 接收 第 二 个 。 


我 们 讲 的 这 两 种 管道 都 是 单 癌 通信 ， 一 个 发 送 一 个 接收 ， 不 能 
过 来 。Rust 没 有 在 标准 库 中 实现 管道 双 癌 通信 。 双 疝 管道 也 不 古 不 可 
能 的 ， 在 第 三 方 库 中 已 经 有 了 实现 。 


第 31 章 ”第 三 方 并 行 开发 库 


在 前 面 的 章节 中 ， 我 们 介绍 了 Rust 标 准 库 提供 的 多 线程 相关 工 
具 。 相 比 于 当下 许多 流行 的 编程 语言 ，Rust 标 准 库 的 设计 是 属于 比较 
基础 、 比 较 原始 的 。 但 是 ，Rust 在 线程 安全 方面 的 设计 具有 非常 好 的 
扩展 性 ， 包 括 标准 库 在 内 的 很 多 实现 并 没有 与 编译 器 深度 绑 定 。 很 多 
高 级 的 抽象 都 可 以 通过 第 三 方 库 的 方式 提供 。 而 且 ， 只 要 设计 合理 ， 
高 质量 的 第 三 方 库 可 以 拥有 和 标准 库 同样 的 “线程 安全 ”特性 。 


本 章 束 挑选 一 些 社区 内 评价 较 高 的 并 行 开发 方面 的 库 ， 做 简单 介 


绍 


31.1 threadpool 


threadpool 是 一 个 基本 的 线程 池 实 现 。 在 标准 库 中 ， 我 们 可 以 用 
std: : thread: : spawn () 方法 创建 新 线程 。 而 这 个 库 可 以 让 我 们 指 
0 它 自动 将 每 个 任务 分 配 到 线程 中 去 执行 。 使 
关节 下 : 


use threadpool::ThreadPool,; 
use std::sync::mpsc::channel; 


fn main() { 
Jet n_ workers = 4; 
let n_jobs = 8; 
let pool = ThreadPool: :new(n_workers); 


let (tx, rx) = channel(); 
for _ in 0..n_ jobs { 
let tx = tx.clonel(); 
pool.execute(move|| { 
tx.send(1).expect("channel will be there waiting for the pool"); 
}); 
} 


assert_eq!(rx.iter().take(n_ jobs).fold(0, |a, bl a + b), 8); 


ThreadPool: : execute 与 std: : thread: : spawn 的 区 别 就 是 ， 它 
需要 先 创 建 一 个 对 象 ， 然 后 调用 : execute 方 法 ， 其 他 都 差不多 。 


31.2 scoped-threadpool 


在 前 面 的 章节 中 ， 我 们 已 经 知道 ， 如 采 要 在 多 线程 之 间 共 至 变 
量 ， 必 须 使 用 Arc 这 样 的 保证 线程 安全 的 智能 指针 。 然 而 ，Arc 是 有 运 
行 期 开销 的 (虽然 很 小 ，。 假 如 我 们 有 时 候 需 要 子 线程 访问 当前 调用 
栈 中 的 局 部 变量 ， 而 且 能 保证 当前 函数 的 生命 周期 一 定 大 于 子 线程 的 
生命 周期 ， 子 线程 一 定 先 于 当前 函数 退出 ， 那 我 们 能 不 能 直接 在 子 线 
程 中 使 用 最 简单 的 借用 指针 & 来 访问 父 线程 栈 上 的 局 部 对 象 呢 ? 


至 少 标准 库 中 的 spawn 孙 数 是 不 行 的 。spawn 的 签名 是 : 


pub fn spawn<F, T>(f: F) -> JoinHandle<T> 
where F: Fnonce() -> T, F: Send + 'static, T: Send + 'static 


注意 这 里 的 闭 包 要 满足 f，'static 约 束 。 这 意味 着 闭 包 中 存在 不 能 
捕获 短 生 命 周 期 的 变量 ， 比 如 指向 当前 局 部 调用 栈 的 指针 。 这 是 因为 
Spawn 函 数 会 将 财 包 传递 给 一 个 新 的 子 线程 ， 这 个 子 线程 的 生命 周期 
很 可 能 大 于 当前 函数 调用 生命 周期 。 如 果 我 们 希望 在 子 线程 中 访问 当 
前 函数 中 的 局 部 变量 ， 怎 么 办 呢 ? 可 以 使 用 第 三 方 库 
scoped _ threadpool。 我 们 来 看 看 scoped_threadpool 是 如 何 使 用 的 : 


extern crate scoped_ threadpool; 
use scoped_threadpool::Pool; 


fn main() { 
let mut pool = Pool: :new(4); 


Jet mut vec = vec![0, 1, 2, 3, 4, 5, 6, 71]; 


pool.scoped(|scope| { 
for e in &mut vec 
scope.execute(move || { 
*e += 1; 
}); 
} 
}); 


println!("{:?}", vec); 


在 这 线程 内 部 直接 使 用 了 &mnut vec 形 式 访问 了 父 线程 “ 栈 ” 上 
变量 ， 站 ° 我 们 可 以 注意 到 ，scoped 方 法 的 签名 是 这 样 


fn scoped<'pool, 'scope, F, R>(&'pool mut self, f: F) -> R 
where F: Fnonce(&Scope<'pool, 'scope>) -> R 


参数 闭 包 的 约束 条 件 没 有 'static 这 一 项 。 所 以 我 们 上 面 的 调 
用 上， 。scoped_threadpool 库 的 源码 并 不 复杂 ， 只 需 一 个 文 
1 各 位 读者 可 以 自己 去 GitHub 上 阅读 它 的 源码 ， 看 看 它 是 怎么 
实现 的 。 


31.3 parking_lot 


Rnust 标 准 库 帮 我们 封装 了 一 些 基 本 的 操作 系统 的 同步 原 语 ， 比 如 
Mutex Condvar 等 。 一 般 情 况 下 这 些 够 我 们 使 用 了 。 但 是 还 有 一 些 对 性 
能 有 极致 妥 求 的 开发 者 对 标准 库 的 实现 并 不 满意 ， 于 是 社区 里 又 有 人 
开发 出 来 了 一 套 替 代 品 ， 在 性 能 和 易 用 性 方面 ， 都 比 标准 库 更 好 ， 这 
就 是 parking_lot 库 。 下 面 的 示例 展示 了 这 个 库 提 供 的 Mutex， 它 的 用 法 
与 标准 库 的 Mutex 差 别 不 大 : 


use std::sync::Arc; 

use parking_lot::Mutex; 

use std::thread; 

use std::sync::mpsc::channel,; 


fn main() { 
const N: usize = 10; 


let data = Arc::new(Mutex: :new(0)); 


let (tx, rx) = channel(); 
for _ in 0..10 
let (data, tx) = (data.clone(), tx.clone()); 
thread::spawn(move || { 
let mut data = data.lock(); 
*data += 1; 
If *data == N { 
tx.send(()).unwrap(); 
} 
}); 
} 


printin!("{}", rx.recv().unwrap()); 


这 个 库 也 给 我 们 展现 了 Rust 在 并 发 方面 的 高 度 可 扩展 性 ， 想 要 实 
现 什么 功能 ， 基 本 不 会 因为 编译 器 的 限制 而 无 法 做 到 。 


31.4 crossbeam 


crossbeam 是 Rust 核 心 组 的 男 外 一 位 重要 成 员 Aaron Turon 率 头 开发 
的 。 它 包含 了 并 行 开发 的 很 多 方面 的 功能 ， 比 如 无 锁 数据 类 型 ， 以 及 
重新 设计 实现 的 管道 。 


我 们 知道 标准 库 给 了 一 份 mpsc 〈 多 生产 者 单 消费 者 ) 管道 的 实 
现 ， 但 是 它 有 许多 缺陷 。crossbeam-channel 这 个 库 给 我 们 提供 了 另外 
一 套 管 道 的 实现 方式 。 不 仅 包括 mpsc， 还 包括 mpmc (多 生产 者 多 消 
费 者 ) ， 而 且 使 用 便捷 ， 执 行 效 率 也 很 高 。 


下 面 是 一 个 双 端 管道 的 使 用 示例 。 它 基本 实现 了 go 语言 的 内 置 管 
道 功能 ， 在 执行 效率 上 甚至 有 过 之 而 无 不 及 。 大 家 可 以 到 GitHub 上 跟 
踩 一 下 这 个 项 目的 进展 。 


extern crate crossbeam 
#[macro_use] 
extern crate crossbeam channel as channel; 


use channel::{Receiver, Sender}; 


fn main() { 
let people = vec!["Anna", "Bob", "Cody", "Dave", "Eva"]; 
let (tx, rx) = channel::bounded(1); // Make room for one unmatched send. 
let (tx, rx) = (&tx, &rx); 
crossbeam::scope(|s| { 
for name in people { 


s.spawn(move || seek(name, tx, rx)); 
}); 
if Jet Ok(name) = rx.try_recv() { 
println!("No one received {}’s message.", name); 


} 


// Either send my name into the channel or receive someone else's, whatever 
happens first. 
fn seek<'a>(name: &'a str, tx: &Sender<&'a str>, rx: &Receiver<&'a str>) { 
select_ loop! { 
recv(rx, peer) => println!("{} received a message from {}.", name, peer), 
send(tx, name) => {}, // Wait for someone to receive my message. 
} 
} 


31.2 rayon 


9 个 很 历 害 的 PLinq 扩 展 ， 可 以 轻松 地 将 linq 语 句 并 行 
。 比如 : 


string[] words = new[] { "Welcome"， "to"，"Beijing"”， "OK"， "Hua"， "Ying", "Ni" 
, "2008"}; 
var lazyBeeQuery = from word in words.AsParallel() select word; 
lazyBeeQuery .ForAll<string>(word => { Console.writeLine(word); }); 


在 新 的 C++17 中 ， 标 准 库 也 文 持 了 一 些 并 行 算法 : 


std: :experimental: :parallel: :for_each( 
std: :experimental::parallel::par，// 并 行 执行 
VvV.begin(), v.end(), functor); 


在 Rust 中 ， 和 迭代 器 基本 已 经 与 jnq 的 功能 差不多 。 那 我 们 能 不 能 做 
个 类 似 的 扩展 ， 让 普通 欠 代 硕 轻 松 变 成 并 行 和 迭代 硕 呢 ? Rayon 的 设计 
目标 惑 是 这 个 。 


Rayon 是 Rust 核 心 组 成 员 Nicholas Matsakis 开 发 的 一 个 并 行 欠 代 怖 

项 目 。 它 可 以 把 一 个 按 顺序 执行 的 任务 轻松 变 成 并 行 执 行 。 它 非常 轻 

0 而 且 使 用 非常 简单 。 而 且 它 保证 了 无 数据 竞争 的 线 
安全 。 


Rayon 的 API 主 要 有 两 种 : 
:并行 迄 代 器 一 一 对 一 个 可 迁 代 的 序列 调用 par_iter 方 法 ， 就 可 以 产 


生 一 个 并 行 大 代 絮 ; 
join 函数 一 一 它 可 以 把 一 个 递归 的 分 治 算法 问题 变 成 并 行 执行 。 


照例 ， 我 们 用 示例 来 说 明 它 的 基本 用 法 。 比 如 ， 我 们 想 对 一 个 整 
数 数组 执行 平方 和 计算 ， 可 以 这 样 做 : 


Use rayon::prelude::*,; 
fn sum_of_squares(input: &[i32]) -> i32 { 


input.par_iter() // iter() 换 成 par_iter() 
.map( |&i| i * i) 
.Sum( ) 


这 个 问题 是 可 以 并 行 计算 的 ， 每 个 元 素 的 平方 操作 互 不 干扰 ， 如 
果 能 让 它们 在 不 同 线程 计算 ， 最 后 再 一 起 求 和 ， 可 以 提高 执行 效率 。 
用 Rayon 来 解决 这 个 问题 很 简单 ， 只 需 将 单线 程 情况 下 的 iter () 方法 
改 为 par_iter () 即 可 。Rayon 会 在 后 人 台 启 动 一 个 线程 池 ， 自 动 分 配 任 
务 ， 将 多 个 元 素 的 map 操 作 分 配 到 不 同 的 线程 中 并 行 执 行 ， 最 后 把 所 
有 的 执行 结果 汇总 再 相 加 。 


类 似 的 ， 这 个 迄 代 器 也 有 mut 版 本 。 假 如 我 们 想 并 行 修改 某 个 数 
组 ， 可 以 这 样 做 : 


use rayon: :prelude::*, 
fn increment_all(input: &mut [i32]) { 
input.par_iter_mut() 
‘for_each(|p| *p += 1); 


} 


Rayon 的 另外 一 种 使 用 方式 是 调用 join 函数 。 这 个 函数 特别 适合 于 
分 治 算法 。 一 个 典型 的 例子 是 写 一 个 快速 排序 算法 : 


fn partition<T:PartialOrd+Send>(v: &mut [T]) -> usize { 
let pivot = v.len() - 1; 
let mut i = 0; 
for j in 0..pivot { 
if v[j] <= v[pivot] { 
v.swap(i, j); 
i += 1; 


} 


VvV.swap(i, pivot),; 
i 


} 


fn quick_sort<T:PartialOrd+Send>(v: &mut [T]) { 
If v.len() <= 1 
return; 


let mid = partition(v); 
let (lo, hi) = v.split at_ mut(mid); 
rayon::join(|| quick_sort(10), || quick_sort(hi)); 


} 


fn main() { 


let mut v = vec![10,9,8,7,6,5,4,3,2,1]; 
quick_sort(&mut v); 
println!("{:?2}", VvV); 

} 


在 快速 排序 算法 中 ， 我 们 可 以 先 把 数组 切 分 为 两 部 分 ， 然 后 分 别 
再 对 这 两 部 分 执行 快速 排序 。 在 这 里 ， 我 们 使 用 了 rayon: : join 函 
数 。 

需要 注音 的 是 ， 并 行 拓 代 絮 和 join 范 数 并 不 是 简单 地 新 建 线 程 ， 
然后 在 两 个 线程 上 分 别 执行 。 它 内 部 实际 上 使 用 了 “work steal” 策 略 。 
它 后 台 的 线程 是 由 一 个 线程 池 管 理 的 ，join 函 数 只 是 把 这 两 个 财 包 作 
为 两 个 任务 分 发 出 去 了 ， 并 不 保证 这 两 个 闭 包 一 定 会 并 行 执行 或 者 串 
行 执 行 。 如 采 现 在 有 至 闲 线程 ， 那 么 空闲 线程 就 会 执行 这 个 任务 。 总 
之 ， 哪 个 线程 有 空 ， 台 在 哪个 线程 上 执行 ， 它 不 会 让 某 些 线程 早早 结 
束 而 让 某 些 任务 在 其 他 线程 里 面 等 待 。 所 以 ， 它 的 开销 是 非常 小 的 。 
Rayon 这 个 库 在 性 能 测试 的 benchmark 上 的 表现 也 是 非常 不 错 的 ， 具 体 
数据 大 家 可 以 查看 官方 网 站 ， 或 者 自行 测试 。 


同时 ， 我 还 要 强调 一 点 ，Rayon 同 样 保证 了 “线程 安全 ”。 比 如 ， 我 
们 如 果 想 在 两 个 任务 中 同时 修改 一 个 数组 ， 编 译作 会 阻止 我 们 : 


fn increment_all(slice: &mut [i32]) { 
rayon::join(|| process(slice), || process(slice)); 
} 


我 们 应 该 能 猜想 到 ， 这 里 的 API 肯 定 用 到 了 Send、Sync 之 类 的 约 
束 ， 束 跟 标准 库 中 的 spawn 芳 数 一 样 。 因 此 第 三 方 库 也 一 样 能 至 受 
到 “线程 安全 ”的 优点 。 


有 关 这 个 库 的 使 用 方法 以 及 其 内 部 实现 原理 ， 在 Nicholas Matsakis 
的 博客 有 详细 摘 述 ， 本 书 篇 幅 有 限 束 不 再 展开 了 。 从 这 个 库 我 们 可 以 
看 到 ，Rust 为 各 种 并 行 开 发 的 模式 提供 了 无 限 的 可 能 性 。 虽 然 标准 库 
在 这 方面 提供 的 直接 选择 不 多 ， 但 并 没有 阻碍 我 们 实现 各 种 各 样 的 第 
I 了 执行 效率 高 、 安 全 性 好 、 扩 
, < 村 点 6 


第 32 章 ”项目 和 模块 


本 书 中 的 绝 大 部 分 代码 示例 部 是 很 短 的 ， 一 个 文件 束 可 以 搞定 。 
但 是 ， 任 何 一 个 规模 稍微 大 一 点 的 项 目 都 不 能 这 么 写 。 我 们 需要 一 个 
机 制 把 一 个 项 目 切 分 成 若干 小 部 分 ， 每 个 部 分 又 可 以 切 分 成 更 小 的 

部 分 层 层 抽象 ， 通 过 这 种 方式 来 管理 复杂 的 代码 。 这 就 是 很 多 编程 
语言 中 都 有 的 “模块 系统 ”。 


Rust 用 了 两 个 概念 来 管理 项 目 : 一 个 是 crate， 一 个 是 mod 。 


crate 简单 理解 就 是 一 个 项 目 。crate 是 Rust 中 的 独立 编译 单元 。 
个 crate 对 应 生成 一 个 库 或 者 本 执行 文件 (如 .lib.dll.so.exe 等 ) 。 1 
一 个 crate 仓 库 https://crates.io/ ， 可 以 供用 户 发 布 各 种 各 样 的 库 ， 用 户 
也 可 以 直接 使 用 这 里 面 的 开源 库 。 


.mod 人 简单 理解 束 是 命名 空间 。mod 可 以 车 套 ， 还 可 以 控制 内 部 元 
素 的 可 见 性 。 


crate 和 mod 有 一 个 重要 区 别 是 : crate 之 间 不 能 出 现 循环 引用 ; 而 
mod 是 无 所 谓 的 ，mod1 要 使 用 mod2 的 内 容 ， 同 时 mod2 要 使 用 mod1 的 
内 容 ， 是 完全 没 问题 的 。 在 Rust 里 面 ， crate 才 是 一 个 完整 的 编译 单元 

(compile unit) 。 也 就 是 说 ，rustc 编 译 器 必须 把 整个 crate 的 内 容 全 
读 进去 才能 执行 编译 ，rustc 不 是 基于 单个 的 .rs 文件 或 者 mod 来 执行 编 
译 的 。 作 为 对 比 ，C/C++ 里 面 的 编译 单元 是 单独 的 .c/.cpp 文 件 以 及 它们 
所 有 的 include 文 件 。 每 个 .c/.cpp 文 件 都 是 单独 编译 ， 生 成 .0 文件 ， 再 把 
这 些 .o 文 件 链接 起 来 。 


本 章 我 们 详细 讲解 一 下 crate 和 mod 。 


32.1 cargo 


Cargo 是 Rust 的 包 管理 工具 ， 是 随 着 编译 絮 一 起 发 布 的 。 在 使 用 
rustup 安 装 了 官方 发 布 的 Rust 开 发 套装 之 后 ，Cargo 工 具 就 已 经 安装 好 
了 ,无须 单 独 安装 。 我 们 可 以 使 用 cargo 命 令 来 查看 它 的 基本 用 法 。 
Cargo 的 官方 使 用 文档 在 这 个 地 址 : https://doc.rust-lang.org/carg0/ 。 


Cargo 可 以 用 于 创建 和 管理 项 目 、 编 译 、 执 行 、 测 试 、 管 理 外 部 下 
载 的 包 和 可 执行 文件 等 。 


J cargo 来 创建 一 个 项 目 ， 一 步 步 市 领 大 家 学 习 cargo 的 
Ws 


< 


我 们 创建 一 个 新 的 工程 ， 这 个 工程 会 生 成 一 个 可 执行 程序 。 步 
0 o 


(1) 进入 项 目 文件 夹 后 ， 使 用 如 下 命令 : 


cargo new hello world --bin 


后 面 的 --bin 选 项 意味 着 我 们 希望 生成 的 是 可 执行 程序 ，cargo 会 帮 
助 我 们 生成 一 个 main.rs 的 模板 文件 。 


如 果 我 们 的 工程 是 一 个 library， 则 可 以 使 用 --lib 选 项 ， 此 时 目 动 生 
成 的 是 一 个 lib.rs 的 模板 文件 。 


(2) 使 用 tree. 命 令 查看 当前 的 文件 夹 结 构 。 可 以 看 到 : 


-一 hello world 
Cargo.toml 
src 
-一 main.rs 


2 directories, 2 files 


其 中 ，Cargo.toml 是 我 们 的 项 目 管理 配置 文件 ， 这 里 记录 了 该 项 目 
相关 的 元 信息 。 关 于 这 个 文件 的 详细 格式 定义 ， 可 以 参考 官方 网 站 上 
的 帮助 文档 : https://doc.rust-lang.org/cargo/ 。 


src 文 件 夹 内 是 源 代 码 。 
(3) 进入 hello_world 文 件 夹 ， 使 用 cargo build 命 令 ， 编 译 项 目 。 
生成 的 可 执行 文件 在 ./target/debug/ 文 件 夹 内 。 如 果 我 们 使 用 cargo 


build--release 命 令 ， 则 可 以 生成 release 版 的 可 执行 文件 ， 它 比 debug 版 
本 优化 得 更 好 。 


(4) 使 用 ./target/debug/hello_world 命 令 ， 或 者 cargo run 命 令 ， 可 
以 执行 我 们 刚 生成 的 这 个 可 执行 程序 。 


在 Rust 中 ， 一 个 项 目 对 应 着 一 个 目标 文件 ， 可 能 是 library， 也 可 能 
是 可 执行 程序 。 现 在 我 们 试 试 给 我 们 的 程序 添加 依赖 项 目 。 


进入 hello_world 的 上 一 层 文 件 夹 ， 新 建 一 个 library 项 目 : 


cargo new good_bye 


lib.rs 文 件 是 库 项 目的 入 口 ， 打 开 这 个 文件 ， 写 入 以 下 代码 : 


pub fn say() { 
println!("good bye"); 


使 用 cargo build， 编 译 通 过 。 现 在 我 们 和 希望 hello_world 项 目 能 引用 
good_bye 项 目 。 打 开 hello_world 项 目的 Cargo.toml 文 件 ， 在 依赖 项 下 面 
添加 对 good_bye 的 引用 。 


[dependencies] 
good bye = { path = "../good bye" } 


二 上 这 个 写法 是 引用 本 地 路 符 中 的 库 "如 果 要 引用 官方 仓库 中 的 库 更 
辣 十 '， 


[dependencies] 
lazy_static = "1.0.0" 


> 现在 在 应 用 程序 中 调用 这 个 库 。 打 开 main.rs 源 文件 ， 修 改 代码 


extern crate good_bye 


fn main() { 
println!("Hello, world!"); 
good_bye: :say(); 

} 


再 次 使 用 cargo run 编 译 执行 ， 束 可 以 看 到 我 们 正确 调用 了 
good_bye 项 目 中 的 代码 。 


cargo 只 是 一 个 包 管 理工 具 ， 并 不 是 编译 絮 。Rust 的 编译 屁 是 
rustc， 使 用 cargo 编 译 工程 实际 上 最 后 还 是 调用 的 rustc 来 完成 的 。 如 末 
我 们 想 知 道 cargo 在 后 面 是 如 何 调用 rustc 完 成 编译 的 ， 可 以 使 用 cargo 
build--verbose 选 项 查看 详细 的 编译 命令 。 


cargo 在 Rust 的 生态 系统 中 扮演 着 非常 重要 的 角色 。 除 了 最 贡 用 的 
cargo new、cargo build、cargo run 等 命令 之 外 ， 还 有 很 多 有 用 的 命令 。 
我 们 可 以 用 cargo-h 来 查看 其 他 用 法 。 现 在 挑选 一 部 分 给 大 家 介绍 : 

‘check 


check 命 令 可 以 只 检查 编译 错误 ， 而 不 做 代码 优化 以 及 生成 可 执行 
程序 ， 非 党 适合 在 开发 过 程 中 快速 检查 语法 、 类 型 错误 。 


‘Clean 

清理 以 前 的 编译 结果 。 
“doc 
生成 该 项 目的 文档 。 


“test 


执行 单元 测试 。 

:bench 

执行 benchmark 性 能 测试 。 

update 

升级 所 有 依赖 项 的 版 本 ， 重 新 生成 Cargo.lock 文 件 。 
“install 


安装 可 执行 程序 。 


-uninstall 
删除 可 执行 程序 。 


其 中 ，cargo install 是 一 个 非常 有 用 的 命令 ， 它 可 以 让 用 户 自 己 扩 
展 cargo 的 子 命令 ， 为 它 增 加 新 功能 。 比 如 我 们 可 以 使 用 


cargo install cargo-tree 


安 狠 一 个 靳 的 cargo 了 于 命令 ， 接 下 来 束 可 以 使 用 


cargo tree 


把 所 有 依赖 项 的 树 型 结构 打印 出 来 。 


在 crates.io 网 站 上 ， 用 subcommand 关 键 字 可 以 搜 出 许多 有 用 的 子 
命令 ， 用 户 可 以 按 需 安装 。 


32.2 ”项 目 依 赖 


在 Cargo.toml 文 件 中 ， 我 们 可 以 指定 一 个 crate 依 赖 哪些 项 目 。 这 些 
依赖 既 可 以 是 来 目 官方 的 crates.io， 也 可 以 是 某 个 git 仓 库 地 址 ， 还 可 以 
是 本 地 文件 路 径 。 示 例如 下 : 


[dependencies] 

lazy_static = "1.0.0" 

rand = { git = https://github.com/rust-lang-nursery/rand, branch = "master" } 
my_own_project = { path = "/my/local/path", version = "0.1.0" } 


Rust 里 面 的 crate 都 是 目 之 版 本 号 的 。 版 本 号 采用 的 是 语义 版 本 的 
思想 (参考 http://semver.org/ ) 。 基 本 意思 如 下 : 


.1.0.0 以 前 的 版 本 是 不 稳定 版 本 ， 如 果 出 现 了 不 兼容 的 改动 ， 升 级 
次 版 本 号 ， 比 如 从 0.2.15 升 级 到 0.3.0; 


:在 1.0.0 版 本 之 后 ， 如 果 出 现 了 不 兼容 的 改动 ， 需 要 升级 主 版 本 
号 ， 比 如 从 1.2.3 升 级 到 2.0.0; 


在 1.0.0 版 本 之 后 ， 如 果 是 兼容 性 的 增加 API， 虽 然 不 会 导致 下 游 
用 户 编译 失败 ， 但 十 增 加 公开 的 API 情 况 ， 应 该 升级 次 版 本 号 。 


下 面 详细 讲 一 下 在 [dependencies] 里 面 的 儿 种 依赖 项 的 格式 : 
(1) 来 自 crates.io 的 依赖 
绝 大 部 分 优质 开源 库 ， 作 者 都 会 发 布 到 官方 仓库 中 ， 所 以 我 们 大 
部 分 的 依赖 都 是 来 目 于 这 个 地 方 。 在 crates.io 中 ， 每 个 库 都 有 一 个 独 一 


无 二 的 名 字 ， 我 们 要 依赖 某 个 库 的 时 候 ， 只 需 指定 它 的 名 字 及 版 本 号 
印 可 ， 比 如 : 


[dependencies] 
lazy_static = "1.0" 


指定 版 本 号 的 时 候 ， 可 以 使 用 模糊 匹配 的 方式 。 


人 符号 ， 如 ^1.2.3 代 表 1.2.3<=version<2.0.0; 

~ 符号 ， 如 ~1.2.3 代 表 1.2.3<=version<1.3.0; 

六 他 号 ， 如 1.* 代 表 1.0.0<=version<2.0.0; 

:比较 符号 ， 比 如 >=1.2.3、>1.2.3、<2.0.0、=1.2.3 含 义 基 本 上 一 目 
了 然 ， 还 可 以 把 多 个 限制 条 件 合 起 来 用 喜 号 分 开 ， 比 如 


version=">1.2, <1.9"° 


直接 写 一 个 数字 的 话 ， 等 同 于 ^ 符 号 的 意思 。 所 以 
lazy_static="1.0" 等 同 于 lazy_static="A1.0"， 含 义 是 
1.0.0<=version<2.0.0。cargo 会 到 网 上 找到 当前 符合 这 个 约束 条 件 的 最 
新 的 版 本 下 载 下 来 。 


(2) 来 自 git 仓 库 的 依赖 


es 了 最 人 简单 的 git="..." 指 定 repository 之 外 ， 我 们 还 可 以 指定 对 应 的 
用 


rand = { git = https://github.com/rust-lang-nursery/rand, branch = "next" } 


或 者 指定 当前 的 commit 号 : 


rand = { git = https://github.com/rust-lang-nursery/rand, branch = "master", rev 
= "31f2663" } 


还 可 以 指定 对 应 的 tag 和 名字: 


rand = { git = https://github.com/rust-lang-nursery/rand, tag = "0.3.15" } 


(3) 来 自 本 地 文件 路 径 的 依赖 
指定 本 地 文件 路 径 ， 既 可 以 使 用 绝对 路 径 也 可 以 使 用 相对 路 径 。 


当 我 们 使 用 cargo build 编 译 完 项 目 后 ， 项 目 文件 夹 内 会 产生 一 个 新 
文件 ， 名 字 叫 Cargo.lock。 它 实际 上 是 一 个 纯 文本 文件 ， 同 样 也 是 toml 
格式 。 它 里 面 记录 了 当前 项 目 所 有 依赖 项 目的 具体 版 本 。 每 次 编译 项 
目的 时 候 ， 如 果 该 文件 存在 ，cargo 束 会 使 用 这 个 文件 中 记录 的 版 本 号 
编译 项 目 ， 如 果 该 文件 不 存在 ，cargo 就 会 使 用 Cargo.toml 文 件 中 记录 
的 依赖 项 目 信息 ， 目 动 选择 最 合适 的 版 本 。 


一 般 来 说 : 如 果 我 们 的 项 目 是 库 ， 那 么 最 好 不 要 把 Cargo.lock 文 件 
纳入 到 版 本 管理 系统 中 ， 避 免 依赖 库 的 版 本 号 被 锁 死 ， 如 果 我 们 的 项 
目 是 可 技 行程 序 ， 那 么 最 好 要 把 Cargo.lock 文 件 纳入 到 版 本 管理 系统 
中 ， 这 样 可 以 保证 ， 在 不 同 机 絮 上 编译 使 用 的 是 同样 的 版 本 ， 生 成 的 
是 同样 的 可 执行 程序 。 


对 于 依赖 项 ， 我 们 不 仅 要 在 Cargo.toml 文 件 中 写 出 来 ， 还 要 在 源 代 
码 中 写 出 来 。 目 前 版 本 中 ， 必 须 在 crate 的 入 口 处 〈 对 库 项 目 就 是 lib.rs 
文件 ， 对 可 执行 程序 项 目 就 是 main.rs 文 件 ) 写 上 : 


extern crate hello; // 声明 外 部 依赖 
extern crate hello as hi; // 可 以 重 命名 


32.2.1 配置 


cargo 也 文 持 配置 文件 。 配 置 文件 可 以 定制 cargo 的 许多 行为 ， 束 像 
我 们 给 git 设 置 配 置 文件 一 样 。 类 似 的 ，cargo 的 配置 文件 可 以 存在 多 
份 ， 它 们 之 间 有 优先 级 关系 。 你 可 以 为 某 个 文件 夹 单独 提供 一 份 配 置 
文件 ， 放 置 到 当前 文件 夹 的 .cargo/config 位 置 ， 也 可 以 提供 一 个 全 局 的 
默认 配置 ， 放 在 $bHOME/.cargo/config 位 置 。 下 面 是 一 份 配置 示例 : 


[cargo-new] 
// 可 以 配置 默认 的 名 字 和 email, 这 些 会 出 现在 新 项 目的 Cargo.toml 中 
name = "..." 


email]l = "..." 


[build] 

jobs = 1 // 并 行 执行 的 rustc 程 序数 量 

rustflags = ["..",，".."] // 编译 时 传递 给 rustc 的 额外 命令 行 参数 
[term] 

verbose = false // 执行 命令 时 是 否 打印 详细 信息 

color = 'auto' // 控制 台 内 的 彩色 显示 

[alias] // 设置 命令 别名 


b = "build" 
t= "test" 


r= "run" 
rr = "run --release" 


更 详细 的 信息 请 参考 官方 文档 。 


32.2.2 workspace 


cargo 的 workspace 概 念 ， 是 为 了 解决 多 crate 的 互相 协调 问题 而 存在 
的 。 假 设 现 在 我 们 有 一 个 比较 大 的 项 目 。 我 们 把 它 拆 分 成 了 多 个 crate 
来 组 织 ， 束 会 面临 一 个 问题 : 不 同 的 crate 会 有 各 目 不 同 的 Cargo.toml， 
编译 的 时 候 它 们 会 各 目 产 生 个 同 的 Cargo. lock 文 件 ， 我 们 无 法 保证 所 有 
的 crate 对 同样 的 依赖 项 使 用 的 是 同样 的 版 本 号 。 


为 了 让 不 同 的 crate 之 间 能 共享 一 些 信息 ，cargo 提 供 了 一 个 
workspace 的 概念 。 一 人 Wn nae | 以 包含 多 个 项 目 ;， 所 有 的 项 目 共 
享 一 个 Cargo.lock 文 件 ， 共 享 同一 个 输出 目录 ; 一 个 workspace 内 的 所 
有 项 目的 公共 信和 项 是 同样 的 版 本 ， 输 出 的 目标 文件 都 在 同一 个 文 


workspace 同 样 是 用 Cargo.toml 来 管理 的 。 我 们 可 以 把 所 有 的 项 目 
都 放 到 一 个 文件 夹 下面 。 在 这 个 文件 夹 下 写 一 个 Cargo.toml 来 管理 这 里 
的 所 有 项 目 。Cargo.toml 文 件 中 要 写 一 个 [workspace] 的 配置 ， 比 如 : 


[workspace] 


members = 
"project1", "lib1" 


整个 文件 夹 的 目录 结构 如 下 : 


FF 一 Cargo.1lock 

FF 一 Cargo.toml 

FF 一 project1 

| 一 Cargo.toml 


| 一 lib1 
| 一 Cargo.toml 
-一 Src 


| [一 1ib .rs 
target 


我 们 可 以 在 workspace 的 根 目录 执行 cargo build 等 命令 。 请 注意 ， 
虽然 每 个 crate 都 有 目 己 的 Cargo.toml 文 件 ， 可 以 各 目 配 置 目 己 的 依赖 
项 ， 但 是 每 个 crate 下 面 不 再 会 各 上 自生 成 一 个 Cargo.lock 文 件 ， 而 是 统一 
在 workspace 下 生成 一 个 Cargo.lock 文 件 。 如 果 多 个 crate 都 依赖 一 个 外 
部 库 ， 那 么 它们 必然 都 是 依赖 的 同一 个 版 本 。 


32.2.3 build.rs 


cargo 工 具 还 允许 用 户 在 正式 编译 开始 前 执行 一 些 目 定义 的 逻辑 。 
方法 是 在 Cargo.toml 中 配置 一 个 build 的 属性 ， 比 如 : 


[package] 
# ，，， 
build = "pbuild,rs" 


自 定 义 逻 辑 就 写 在 build.rs 文 件 里 面 。 在 执行 cargo build 的 时 候 ， 
cargo 会 先 把 这 个 build.rs 编 译 成 一 个 可 执行 程序 ， 然 后 运行 这 个 程序 ， 
做 完 后 再 开始 编译 真正 的 crate。build.rs 一 般 用 于 下 面 这 些 情况 : 

:提前 调用 外 部 编译 工具 ， 比 如 调用 gcc 编 译 一 个 C 库 ; 

:在 操作 系统 中 查找 C 库 的 位 置 ; 

.根据 某 些 配置 ， 目 动 生 成 源码 ; 

执行 某 些 平台 相关 的 配置 。 


build.rs 里 面 甚至 可 以 再 依赖 其 他 的 库 。 可 以 在 build-dependencies 
里 面 指定 : 


[build-dependencies] 
rand = "1.0" 


build.rs 里 面 如 果 需 要 读 取 当前 crate 的 一 些 信 息 ， 可 以 通过 环境 变 
量 来 操作 。cargo 在 执行 这 个 程序 之 前 就 预先 设置 好 了 一 些 环境 变量 ， 
比较 常用 的 有 下 面 儿 种 。 


“CARGO MANIFEST_ DIR 

当前 crate 的 Cargo.toml 文 件 的 路 径 。 
‘CARGO PKG NAME 

当前 crate 的 名 字 。 

‘OUT_DIR 


buildrs 的 输出 路 径 。 如 果 要 在 build.rs 中 生成 代码 ， 那 么 生成 的 代 
码 就 要 存在 这 个 文件 夹 下 。 


:HOST 

当前 rustc 编 译 器 的 平台 特性 。 
“OPT_LEVEL 

优化 级 别 。 

"PROFILE 

判断 是 release 还 是 debug 版 本 。 


更 多 的 环境 变量 请 参考 cargo 的 标准 文档 。 


下 面 还 是 用 一 个 完整 的 示例 演示 一 下 build.rs 功 能 如 何 使 用 。 假 设 
我 们 现在 要 把 当前 项 目 最 新 的 commit id 记录 到 可 执行 程序 里 面 。 这 种 
需求 就 必须 使 用 自动 代码 生成 来 完成 。 首 先 新 建 一 个 项 目 


with_commit hash: 


cargo new -bin with_commit_hash 


然后 ， 到 Cargo.toml 里 面 加 上 : 


build = "build.rs" 


当然 ， 对 应 的 ， 要 在 项 目 文件 夹 下 创建 一 个 build.rs 的 文件 。 


我 们 希望 能 在 编译 过 程 中 生成 一 份 源 代 码 文 件 ， 里 面 记录 了 一 个 
常量 ， 类 似 这 样 : 


const CURRENT_ COMMIT_ID : &’static str = "123456789ABCDEF"; 


查找 当前 git 的 最 新 commit id 可 以 通过 命令 git rev-parse HEAD 来 完 
成 。 所 以 ， 我 们 的 build.rs 可 以 这 样 实现 : 


use std::env; 

use std::fs::File,; 

Use std::io: :Write,; 

use std::path::Path; 

Use std::process::Command; 


fn main() { 
let out_dir = env::var("OUT_DIR").unwrap(); 
let dest_path = Path::new(&out_dir).join("commit_id.rs"); 
let mut f = File::create(&dest_path).unwrap(); 


let commit = Command: :new("git") 
.arg("rev-parse") 
.arg("HEAD") 
.Output() 
.expect("Failed to execute git command"); 
let commit = String::from utf8(commit.stdout).expect("Invalid utf8 string"); 


Jet output = format!(r#"pub const CURRENT_COMMIT_ID : &'static Str = "{}";" 
#, commit); 


f.write all(output.as_bytes()).unwrap(); 
} 


输出 路 径 是 通过 读 取 OUT_DIR 环 境 变量 获得 的 。 利 用 标准 库 里 面 
的 Command 类 型 ， 我 们 可 以 调用 外 部 的 进程 ， 并 获得 它 的 标准 输出 结 
果 。 最 后 再 构造 出 我 们 想 要 的 源码 字符 串 ， 写 入 到 目标 文件 中 。 


生成 了 这 份 代 码 之 后 ， 我 们 怎么 使 用 呢 ? 在 main.rs 里 面 ， 可 以 通 
过 宏 直接 把 这 部 分 源码 包含 到 项 目 中 来 : 


include!(concat!(env!("OUT_DIR"), "/commit_id.rs")); 


fn main() { 
println!("Current commit Id is: {}", CURRENT_COMMIT_ID); 


这 个 include! 宏 可 以 直接 把 目标 文件 中 的 内 容 在 编译 阶段 复制 到 
当前 位 置 。 这 样 main 函 数 就 可 以 访问 CURRENT_COMMIT_ID 这 个 常 
量 了 。 大 家 要 记得 在 当前 项 目 使 用 git 命 令 新 建 几 个 commit。 然 后 编 
译 ， 执行 ， 可 见 在 可 执行 程序 中 包含 最 新 commit id 这 个 任务 就 完全 自 
动 化 起 来 了 。 


32.3 ”模块 管理 


前 面 我 们 讲解 了 如 何 使 用 cargo 工 具 管理 crate。 接 下 来 还 要 讲解 一 
个 crate 内 部 如 何 管 理 模块 。 可 惜 的 是 ，Rust 设 计 组 觉得 目前 的 模块 系统 
还 有 一 些 瑕 癣 ， 谁 备 继 续 改 进 ， 在 编写 本 书 的 时 候 这 部 分 内 容 正 处 在 
热火 组 天 的 讨论 过 程 中 。 改 进 的 目标 是 思维 模型 更 和 价 洁 、 更 加 具备 一 
致 性 、 方 便 各 个 层次 的 用 户 。 所 以 本 书 在 这 部 分 不 会 强调 太 多 的 细 
节 ， 因 为 目前 一 些 看 起 来 比较 繁复 的 细 市 将 来 很 可 能 会 得 到 人 简化 。 


32.3.1 ”文件 组 织 


mod (模块 ) 是 用 于 在 crate 内 部 继续 进行 分 层 和 封装 的 机 制 。 模 块 
内 部 又 可 以 包含 模块 。Rust 中 的 模块 是 一 个 典型 的 树 形 结构 。 每 个 crate 
会 目 动 产生 一 个 跟 当 前 crate 同 名 的 模块 ， 作 为 这 个 树 形 结构 的 根 广 
点 。 比 如 在 前 面 使 用 cargo 创 建 多 个 项 目的 示例 中 ， 项 目 hello_world 依 
赖 于 项 目 good_bye， 我 们 要 调用 good_bye 中 的 函数 ， 需 要 写 
good_bye: : say () ; ， 这 是 因为 say 方 法 存在 于 good_bye 这 个 mod 
中 。 它 们 组 成 的 树 形 关 系 如 下 图 所 示 : 


mod hello world 


I fn main | mod good bye 


‖ fn say | 


在 一 个 crate 内 部 创建 新 模块 的 方式 有 下 面 几 种 。 


一 个 文件 中 创建 内 岁 模 块 。 直 接 使 用 mod 关 键 字 即 可 ， 模 块 内 容 
包 仿 到 大 括号 内 部 。 


mod name { fn items() {} ...} 


:独立 的 一 个 文件 就 是 一 个 模块 。 文 件 名 即 是 模块 名 。 


一 个 文件 夹 也 可 以 创建 一 个 模块 。 文 件 夹 内 部 要 有 一 个 mod.rs 文 
件 ， 这 个 文件 束 是 这 个 模块 的 入 口 。 


使 用 哪 种 方式 编写 模块 取决 于 当时 的 场景 。 如 果 我 们 需要 创建 一 
个 小 型 子 模块 ， 比 如 单元 测试 模块 ， 那 么 直接 写 到 一 个 文件 内 部 就 非 
常 们 单 而 有 旦 直观 ， 如 果 一 个 模块 内 容 相 对 有 点 多 ， 那 么 把 它 单 独 写 到 
一 个 文件 内 是 更 容易 维护 的 ;如 果 一 个 模块 的 内 容 太 多 了 ， 那 么 把 它 
放 到 一 个 文件 夹 中 束 更 合理 ， 因 为 我 们 可 以 把 真正 的 内 容 继续 分 散 到 
更 小 的 子 模块 中 ， 而 在 mod.rs 中 直接 重新 导出 (re-export) 。 这 样 
modrs 的 源码 就 大 幅 简 化 ， 不 影响 外 部 的 调用 者 。 

可 以 这 样 理解 : 模块 是 一 种 更 抽象 的 概念 ， 文 件 是 承载 这 个 概念 
的 实体 。 但 是 模块 和 文件 并 不 是 简单 的 一 一 对 应 关系， 用 户 可 以 目 己 
维护 这 个 映 冉 天 系 。 


比如 ， 我 们 有 一 个 crate 内 部 包含 了 两 个 模块 ， 个 是 caller 一 个 是 
worker。 我 们 可 以 有 几 种 方案 来 实现 。 


方案 一 : 直接 把 所 有 代码 都 写 到 lib.rs 里 面 : 


// <lib.rs> 
mod caller { 
fn call() {} 


mod worker { 
fn work1() 1 
fn work2() 人 
fn work3() 从 


方案 二 : 把 这 两 个 模块 分 到 两 个 不 同 的 文件 中 ， 分 别 叫 作 caller.rs 
和 worker.rs。 那么 我 们 的 项 目 束 有 了 三 个 文件 ， 它 们 的 内 容 分 别 是 : 


// <lib.rs> 
mod caller; 
mod worker; 

// <caller.rs> 
fn call() {} 
// <worker.rs> 
fn work1() {€} 


fn work2() 人 
fn work3() 1{} 


因为 lib.rs 是 这 个 crate 的 入 口 ， 我 们 需要 在 这 里 声明 它 的 所 有 子 模 
块 ， 否 则 caller.rs 和 worker.rs 都 不 会 被 当成 这 个 项 目的 源码 编译 。 


方案 三 ， 如 果 workerrs 这 个 文件 包含 的 内 容 太 多 ， 我 们 还 可 以 继续 
分 成 几 个 文件 


// <lib.rs> 

mod caller; 

mod worker ， 

// <caller.rs> 

fn call() {} 

// <worker/mod.rs> 

mod workeril1; 

mod worker2; 

mod worker3; 

// <worker/workeri1.rs> 
fn work1() 1{} 

// <worker/worker2.rs> 
fn work2() 人 

// <worker/worker3.rs> 
fn work3() 从 


这 样 束 把 一 个 模块 继续 分 成 了 几 个 小 模块 。 而 且 worker 模 块 的 拆 分 
其 实 是 不 影响 caller 模 块 的 ， 只 要 我 们 在 worker 模 块 中 把 它 子 模块 内 部 
的 东西 重新 导出 (re-export) 束 可 以 了 。 这 个 是 可 见 性 控制 的 内 容 ， 下 
面 我 们 继续 介绍 可 见 性 控制 。 


32.3.2 可见 性 


我 们 可 以 给 模块 内 部 的 元 素 指 定 可 见 性 。 默 认 都 是 私有 ， 除 了 两 
种 例外 情况 ， 一 是 用 pub 修 饰 的 trait 内 部 的 关联 元 素 (associated 
item) ， 默 认 是 公开 的 ; 二 是 pub enum 内 部 的 成 员 默 认 是 公开 的 。 公 开 
和 私有 的 访问 权限 是 这 样 规定 的 : 


-如 有 宁 一 个 元 陛 是 私有 的 ， 那 么 只 有 本 模块 内 的 元 素 以 及 它 的 子 模 
块 可 以 访问 ; 


如 末 一 个 元 素 是 公开 的 ， 那 么 上 一 层 的 模块 就 有 权 访 问 它 。 


示例 如 下 : 


mod top_mod1 { 
pub fn method1() 人 


pub mod inner_mod1 { 
pub fn method2() 1{} 


fn method3() 人 


mod inner_mod2 { 
fn method4() {} 


mod inner_mod3 { 
fn call fn_inside() { 
super: :method4( ); 
} 
} 
} 
} 


fn call fn outside() { 
:top_mod1: :method1(); 
;:top_modi::inner_mod1: :method2(); 
} 


在 这 个 示例 中 ，top_mod1 外 部 的 函数 call_fn_outside () ， 有 权 访 
问 method1 () ， 因 为 它 是 用 pub 修 饰 的 。 同 样 也 可 以 访问 method2 
() ， 因 为 inner_mod1 是 pub 的 ， 而 且 method2 也 是 pub 的 。 而 
inner_ mod2 不 是 pub 的 ， 所 以 外 部 的 函数 是 没 法 访问 method4 的 。 但 是 
call_fn_inside 是 有 权 访 问 method4 的 ， 因 为 它 在 method4 所 处 模块 的 子 模 
块 中 。 


模块 内 的 元 素 可 以 使 用 pub use 重 新 导出 (re-export) 。 这 也 是 Rust 
模块 系统 的 一 个 重要 特点 。 示 例如 下 : 


mod top_mod1 { 
pub use Self: :inner_mod1::method1， 


mod inner_mod1 { 
pub use self::inner_mod2:;:methodi1; 


mod inner_mod2 { 
pub fn method1() {€} 


fn call fn outside() { 
:top_mod1i: :method1(); 


在 call_fn_outside 函 数 中 ， 我 们 调用 了 top_modl 中 的 函数 method1。 
可 是 我 们 注意 到 ，method1 其 实 不 是 在 top_mod1 内 部 实现 的 ， 它 只 是 把 
它 内 部 inner_ mod1l 里 面 的 函数 重新 导出 了 而 已 。pub use 就 是 起 这 样 的 
作用 ， 可 以 把 元 素 当 成 模块 的 直接 成 员 公 开 出 去 。 我 们 继续 往 下 看 还 
可 以 发 现 ， 这 个 函数 在 inner_mod1 里 面 也 只 是 重新 导出 的 ， 它 的 真正 实 
现 是 在 inner mod2 里 面 。 


这 个 机 制 可 以 让 我 们 轻松 做 到 接口 和 实现 的 分 离 。 我 们 可 以 先 设 
计 好 一 个 模块 的 对 外 API， 这 个 固定 下 来 之 后 ， 它 的 具体 实现 是 可 以 随 
便 改 ， 不 影响 外 部 用 户 的 。 我 们 可 以 把 具体 实现 写 到 任何 一 个 子 模块 
中 ， 然 后 在 当前 模块 重新 导出 即 可 。 对 外 部 用 户 来 说 ， 这 没什么 区 


We 


不 过 这 个 机 制 有 个 矿 烦 之 处 就 古 ， 如 琳 具 体 实现 敬 套 在 很 深层 次 
的 子 模块 中 的 话 ， 要 把 它 导出 到 最 外 面 来 ， 必 须 一 层 层 地 转发 ， 任 何 
一 层 没有 重新 导出 ， 痢 是 无 法 达到 目标 的 。 


Rust 里 面 用 pub 标 记 了 的 元 素 最 终 可 能 在 哪 一 层 可 见 ， 并 不 能 很 简 
单 地 得 出 结论 。 因 为 它 有 可 能 个 外 面 重新 导出 。 为 了 更 清晰 地 限制 可 
见 性 ，Rust 设 计 组 又 给 pub 关 键 字 增加 了 下 面 的 用 法 ， 可 以 明确 地 限定 
元 素 的 可 见 性 : 


pub(crate) 

pub(in xxx_mod) 

pub(self) 或 者 pub(in self) 
pub(super) 或 者 pub(in super) 


示例 如 下 : 


mod top_mod { 
pub mod inner_mod1 区 
pub mod inner_mod2 { 
pub(self) fn method1() 1 
pub(super) fn method2() 全 
pub(crate) fn method3() 全 


// Error : 


// pub use Self::inner _ mod2::method1， 
fn caller1() { 


// Error: 
// self::inner_mod2::method1(); 
} 
} 
fn caller2() { 
// Error: 
// self::inner_mod1::inner_mod2::method2(); 
} 
} 
// Error: 


// pub use ::top_mod::inner_modi1::inner_mod2::method3; 


在 inner_mod2 模 块 中 定义 了 几 个 函数 。method1 用 了 pub (self) 限 
制 ， 那 么 它 最 多 只 能 被 这 个 模块 以 及 子 模块 使 用 ， 在 模块 外 部 调用 或 
者 重新 导出 都 会 出 钳 。method2 用 了 pub (super) 限制 ， 那 么 它 的 可 见 
性 最 多 就 只 能 到 inner_mod1 这 一 层 ， 在 这 层 外 面 不 能 被 调用 或 者 重新 导 
出 。 而 method3 用 了 pub (crate) 限制 ,那么 它 的 可 见 性 最 多 就 只 能 到 
当前 crate 这 一 层 ， 再 继续 往外 重新 导出 ， 就 会 出 错 。 


32.3.3” ”use 关键 字 
前 面 我 们 用 了 很 多 完整 路 径 来 访问 元 素 。 比 如 : 


::top_mod1::inner_mod1: :method2(); 


Rust 里 面 的 路 径 有 不 同 写法 ， 它 们 代表 的 售 义 如 下 : 


.以 ，， 开头 的 路 径 ， 代 表 全 局 路 径 。 它 是 从 crate 的 根部 开始 算 


mod top_mod1 { 
pub fn f1() 全 
} 


mod top_mod2 { 
pub fn call() { 
::top_mod1i::f1(); // 当前 crate 下 的 top_mod1 
} 


} 


:以 super 关 键 字 开头 的 路 径 是 相对 路 径 。 它 是 从 上 层 模 块 开 始 算 


» 


mod top_mod1 { 
pub fn f1() 全 


mod inner_mod1 { 
pub fn call() { 
super::f1(); // 当前 模块 inner_mod1 的 父 级 模块 中 的 f1 画 数 


:以 self 关 键 字 开 头 的 路 径 是 相对 路 径 。 它 是 从 当前 模块 开始 算 的 : 


mod top_mod1 { 
pub fn fl() 全 


pub fn call() { 
self::f1(); // 当前 模块 top_mod1i 中 的 f1 函 数 


如 有 果 我 们 需要 经 党 重 复 性 地 写 很 长 的 路 径 ， 那 么 可 以 使 用 use 语 名 
把 相应 的 元 素 引 入 到 当前 的 作用 域 中 来 。 


"use 语句 可 以 用 大 括号 ， 一 句 话 引入 多 个 元 素 : 


use std::io::{self，Read，Write}; // 这 句 话 引 入 了 io / Read / Write 三 个 名 字 


use 语句 的 大 括号 可 以 骨 套 使 用 : 


use a::b::{c, d, e::{f, g::{h, i}} }; 


use 语句 可 以 使 用 星 号 ， 引 入 所 有 的 元 素 : 


use std::io::prelude:;:*; // 这 句 话 引入 了 std::io::prelude 下 面 所 有 的 名 


use 语 名 不仅 可 以 用 在 模块 中 ， 还 可 以 用 在 画 数 、trait 、impl 等 地 


fn call() { 
use std::collections: :Hashset,; 


let s = HashSet::<i32>: :new(); 
} 


use 语句 允许 使 用 as 重 命名 ， 避 人 免 名 字 冲 突 : 


use std::result::Result as StdResult; 
use std::io::Result as IoResult,; 


第 33 章 ”错误 处 理 


普 误 处 理 指 的 是 处 理 程序 的 非 正 常 执行 流程 。 比 如 ， 我 们 要 打开 
一 个 文件 ， 殊 不 能 只 考虑 文件 正常 打开 情况 ， 在 实际 中 有 可 能 因为 各 
a 
第 行 流 


Rust 把 错误 分 成 了 两 大 类 。 一 类 是 不 可 恢复 错误 ， 建 议 使 用 panic 
来 处 理 。 对 于 不 可 恢复 错误 ， 本 质 上 没有 办 法 在 程序 执行 阶段 做 好 处 
理 的 ， 那 么 就 应 该 用 panic 计 程序 主动 退出 ， 由 开发 者 来 修复 源码 ， 这 
是 唯一 合理 的 方案 。 另 外 一 类 错误 是 可 恢复 错误 ， 一 般 使 用 返回 值 来 
处 理 。 比 如 打开 文件 出 错 这 种 问题 ， 应 该 是 设计 阶段 能 预计 到 的 ， 可 
以 在 执行 阶段 更 好 处 理 的 问题 ， 丈 适合 采用 这 种 方案 。 本草 主要 关注 
这 一 类 的 错误 处 理 。 


33.1 基本 错误 处 理 


Rnust 的 错误 处 理 机 制 ， 主 要 还 是 基于 返回 值 的 方案 。 不 过 因为 拥 
有 代数 类 型 系统 这 套 机 制 ， 所 以 它 比 C 语 言 那 种 原始 的 错误 和 码 方案 表 
达能 力 更 强 一 点 。Rust 用 于 错误 处 理 的 最 基本 的 类 型 就 是 我 们 常见 的 
0 。 比 如， 内 置 字 符 串 类 型 有 一 个 find 方 法 ， 查 找 一 个 子 


Impl str { 
pub fn find<'a, P: Pattern<'a>>(&'a self, pat: P) -> Option<usize> {} 


这 个 方法 当然 是 可 能 失败 的 ， 它 有 可 能 找 不 到 。 为 了 表达 “成 功 返 
回 了 一 个 值 ?以 及 “没有 返回 值 " 这 两 种 情况 ，Option<usize> 束 是 一 个 非 
常 合理 的 选择 。 而 在 传统 的 C 语 言 里 面 ， 由 于 缺乏 代数 类 型 系统 ， 往 
往 会 选择 使 用 返回 类 型 中 的 某 些 特殊 值 来 表示 非 正常 的 情况 。 比 如 ， 
C 标 准 库 中 的 子 串 查找 函数 的 签名 是 这 样 的 : 


char *strstr( const char* str, const char* Substr ) 癸 


返回 的 吏 是 char* 指 针 ， 使 用 空 指 针 代表 没 找 到 的 情况 。 


对 于 这 种 简单 的 错误 处 理 ， 这 么 凑合 一 下 问题 也 不 大 。 如 有 果 错 误 
信息 更 复杂 一 些 ， 比 如 既 需 要 用 错误 码 表 示 错 误 的 原因 ， 又 需要 返回 
正常 的 返回 值 ， 束 矿 烦 一 些 了 。 一 般 C 语 言 的 做 法 是 ， 用 返回 值 代表 
错误 码 ， 把 真正 需要 返回 的 内 容 使 用 指针 通过 参数 传递 出 去 。 比 如 
C99 里 面 打开 文件 的 函数 是 这 样 设计 的 : 


FILE *fopen( const char *restrict filename, const char *restrict mode ); 


到 了 C11 又 新 增 了 一 个 文 持 多 个 错误 码 的 打开 文件 的 函数 : 


errno_t fopen_s(FILE *restrict *restrict streamptr, 
const char *restrict filename, 


const char *restrict mode); 


这 种 方式 明显 是 牺牲 了 可 读 性 和 使 用 方便 性 的 。 


在 Rust 里 面 头 不用 这 么 麻烦 了 。 我 们 可 以 使 用 Result<T，E> 类 型 
来 处 理 这 种 情况 ， 干 净利 落 : 


impl] File { 
pub fn open<P: AsRef<Path>>(path: P) -> io::Result<File> {} 
} 


上 面 这 个 例子 使 用 了 std: : io: : Result 类 型 ， 而 不 是 std: : 
result: : Result 类 型 。 但 是 实际 上 它们 是 一 回 事 ， 因 为 在 io 模块 中 有 
个 类 型 别名 的 定义 : 


pub type Result<T> = result::Result<T, Error>,; 


这 束 是 说 ，std: : io: : Result<T> 等 于 std: : result: 
Result<T，std: : io: : Error>。 只 是 把 泛 型 中 的 E 参 数 定 成 了 std: 
io: : Error 这 个 具体 类 型 而 已 。 


代数 类 型 系统 是 错误 处 理 的 利 右 。 我 们 再 看 一 个 例子 。 标 准 库 中 


有 一 个 FromStr trait: 


pub trait FromStr: Sized { 

type Err， 

fn from_str(s: &str) -> Result<Self, Self::Err>,; 
} 


如 琳 我 们 想 》 一 个 字符 捉 构 造 出 -个 类 型 的 实例 ， 就 可 以 对 这 个 
类 型 实现 这 个 trait。 当然 这 个 转换 是 有 可 能 出 错 的 ， 所 以 from_str 方 法 
一 定 要 返回 一 个 Result 类 型 。 比 如 针对 bool 类 型 实现 的 这 个 trait: 


Impl FromStr for bool { 
type Err = ParseBoolError， 
#[inline] 
fn from_str(s: &str) -> Result<bool, ParseBoolError> { 
match s { 
"true"” => Ok(true), 


"false" => Ok(false), 
=> Err(ParseBoolError { _priv: () }), 


} 
} 
} 


正常 情况 是 bool 类 型 ， 异 和 津 情 况 是 ParseBoolError 类 型 。 这 个 
ParseBoolError 不 需要 携 训 其 他 额外 信息 ， 所 以 它 是 一 个 空 结构 体 就 够 
Re 


我 们 再 看 看 FromStr 针 对 f32 的 实现 。 可 以 看 到 ， 从 字符 串 解析 浮 
点 数 可 能 出 现 的 错误 种 类 更 多 ， 所 以 错误 类 型 被 设计 成 了 一 个 enum: 


enum FloatErrorkind { 
Empty, 
Invalid, 


} 


最 后 我 们 再 看 看 FromStr 针 对 String 的 实现 。 因 为 从 &str 到 String 的 
这 个 转换 一 定 是 可 以 成 功 的 ， 不 存在 失败 的 可 能 ， 所 以 这 种 情况 下 错 
误 类 型 被 设计 成 了 空 的 enum: 


pub enum ParseError {} 


前 面 我 们 已 经 说 过 了 ， 容 的 enum 束 是 bottom type， 等 同 于 发 散 类 
型 ! 。 所 以 这 个 错误 实际 上 没有 任何 额外 性 能 开销 ， 证 明 如 下 : 


use std::str::Fromstr; 
Use std::string::ParseError; 
use std::mem::{size of, size of_val}; 


fn main() { 
let r : Result<String, ParseError> = FromSstr::from str("hello"); 
println!("Size of String: {}", size_of::<String>()); 
println!("Size of ‘r’: {}", Size_of_val(&r)); 


这 个 返回 类 型 Result<String，ParseError> 实 际 上 和 String 是 同 构 
时 。 


所 以 说 ，Rust 的 这 万 错误 处 理 机 制 既 具备 民 好 的 抽象 性 ， 也 具备 
无 额外 性 能 损失 的 优点 。 


33.2 组合 错误 类 型 


利用 代数 类 型 系统 做 错误 处 理 的 另外 一 大 好 处 是 可 组 合 性 
(composability) 。 比 如 Result 类 型 有 这 样 的 一 系列 成 员 方 法 : 


fn map<U, F>(self, op: F) -> Result<U, E> where F: Fnonce(T) -> U 

fn map_err<F, 0O>(self, op: 0) -> Result<T, F> where 0: Fnonce(E) -> F 

fn and<U>(self, res: Result<U, E>) -> Result<U, E> 

fn and_then<U, F>(self, op: F) -> Result<U, E> where F: Fnonce(T) -> Result<U, E> 
fn or<F>(self, res: Result<T, F>) -> Result<T, F> 

fn or_else<F, 0>(self, op: 0) -> Result<T, F> where 0: Fnonce(E) -> Result<T, F> 


这 些 方法 的 签名 稍微 有 点 复杂 ， 涉 及 许多 沁 型 参数 。 写 们 之 则 的 
区 别 也 束 表 现在 方法 侈 名 中 。 我 们 可 以 用 下 面 的 方式 去 挥 语法 干扰 之 
后 ， 来 阅读 函数 签名 ， 从 而 理解 这 些 方法 之 则 的 区 别 : 


方 法 参数 类 型 
and_ then T -> Result<U, E> 
or else B -> Result<T, F> 


通过 这 个 表格 的 对 比 ， 我 们 可 以 很 容易 看 出 它们 之 间 的 区 别 。 
et er ee 
换 ， 而 and_then 的 参数 是 T->Result 的 转换 。Option 类 型 也 有 类 似 的 对 应 
的 方法 ， 读 者 可 以 自己 建 一 个 表格 ， 对 比 一 下 这 些 方法 签名 之 间 的 区 


别 。 


下 面 用 一 个 示例 演示 一 下 这 些 组 合 函 数 的 用 法 : 


use std::env; 


fn double arg(mut argv: env::Args) -> Result<i32, String> { 
argv.nth(1) 
.Ok_or("Please give at least one argument".to_owned()) 
.and_then(|arg| arg.parse::<i32>().map_err( 
lerr| err.to_string())) 
.map(|In| 2 * n) 


fn main() { 
match double arg(env::args()) { 
Ok(n) => println!("{}", nN), 
Err(err) => printin!("Error: {}", err), 
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Result 类 型 的 组 合 调用 功能 很 强大 ， 但 是 它 有 一 个 缺 氮 ， 束 是 经 
常会 发 生 骨 套 层次 太 多 的 情况 ， 不 利于 可 读 性 。 比 如 下 面 这 个 示例 : 


use std::fs::File; 
Use std::io::Read; 
use std::path::Path; 


fn file double<P: AsRef<Path>>(file path: P) -> Result<i32, String> { 
File: :open(file_path) 
.map_err(l|err| err.to_string()) 
.and_then(|mut file| { 
let mut contents = String::new(); 
file.read_ to_string(&mut contents) 
.map_err(l|err| err.to_string()) 
.map(|_| contents) 


.and_then(|contents| { 
contents.trim().parse: :<i32>() 
.map_err(l|err| err.to_string()) 


}) 
.map(|n| 2 * mn) 
} 


fn main() { 
match file double("foobar") { 
Ok(n) => printjn!("{}", Nn), 
Err(err) => println!("Error: {}", err), 
} 
} 


这 说 明 我 们 还 有 继续 改进 的 空间 。 为 了 方便 用 户 ，Rust 设 计 组 在 
前 面 这 套 系 统 的 基础 上 ， 又 加 入 了 一 个 问号 运算 符 ， 用 来 简化 源 代 
上 。 这 个 问号 运算 符 完 全 是 建立 在 前 面 这 套 错 误 处 理 机 制 上 的 语法 


问号 运算 符 意 思 是 ， 如 采 结 果 是 Err， 则 提前 返回 ， 人 否则 继续 执 


使 用 问号 运算 符 ， 我 们 可 以 把 匀 e_double 函 数 简 化 成 这 样 : 


fn file_ double<P: AsRef<Path>>(file path: P) -> Result<i32, String> { 
let mut file = File::open(file path).map_err(l|el| e.to_string())?; 
let mut contents = String::new(); 


file.read_to_string(&mut contents ) 
,map_err(lerr|l err.to_string())?; 
let n = contents.trim().parse::<i32>() 
.map_err(|err| err.to_string())?; 


Ok(2 * mn) 


这 里 依然 有 不 少 的 map_err 调 用 ， 主 要 原因 是 返回 类 型 限制 成 了 
Result<i32，String>。 如 有 果 改 一 下 返回 类 型 ， 代 码 还 能 继续 精简 。 


因为 这 段 代 码 总 共有 两 种 错误 : 一 种 是 io 错 误 ， 用 std: : io: 
Error 表 示 ; 另外 一 种 是 字符 串 转 整数 钳 误 ， 用 std: : num: : 
ParseIntError 表 示 。 我 们 要 把 这 两 种 类 型 统一 起 来 ， 所 以 使 用 了 一 个 目 
定义 的 enum 类 型 ， 这 样 map_err 方 法 调用 就 可 以 省 略 了 。 我 们 再 补充 
这 两 种 错误 类 型 到 目 定义 错误 类 型 之 间 的 类 型 转换 ， 问 题 束 解决 了 。 
完整 源码 如 下 所 示 : 


use std::fs::File,; 
use std::io::Read; 
use std::path::Path; 


#[derive(Debug)] 

enum MyError { 
Io(std::io::Error), 
Parse(std: :num: :ParseIntError), 


} 


impl From<std::io::Error> for MyError { 
fn from(error: std::io::Error) -> Self { 
MyError::Io(error) 
} 


} 


impl From<std: :num: :ParseIntError> for MyError { 
fn from(error: std::num::ParseIntError) -> Self { 
MyError::Parse(error) 
} 


} 


fn file_double<P: AsRef<Path>>(file path: P) -> Result<i32, MyError> { 
let mut file = File::open(file path)?; 
let mut contents = String::new(); 
file.read_ to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>( )?; 
Ok(2 * n) 
} 


fn main() { 
match file double("foobar") { 
Ok(n) => printjn!("{}", Nn), 
Err(err) => println!("Error: {:?}", err), 


文件 三 <: 这 个 fe double 函数 吏 精 向 太 多 了 ° 它 只 需 管理 正常 
逻辑 ， 对 于 可 能 错 的 分 文 ， 和 直接 一 个 问号 操作 符 提 前 返回 ， 销 误 处 
理 和 正常 逻辑 互 不 干扰 ， 清 晰 易 读 。 


下 面 继续 讲解 一 下 问号 运算 符 背后 做 了 什么 事情 。 跟 其 他 很 多 运 
算 符 一 样 ， 问号 运 和 符 也 对 应 着 标准 库 中 的 一 个 trait std: : ops: : 
Try。 它 的 定义 如 下 : 


trait Try { 
type OKk 
type Error， 
fn into_result(self) -> Result<Self::Ok, Self::Error>; 
fn from error(v: Self::Error) -> Self; 
fn from ok(v: Self::0Ok) -> Self,; 


编译 器 会 把 expr? 这 个 表达 式 自 动 转换 为 以 下 语义 (不 在 catch 块 
内 的 情况 ) : 


match Try: :into_result(expr) { 
Ok(v) => v, 


// here, the ‘return presumes that there is 
// no catch ”in scope: 
Err(e) => return Try::from error(From::from(e)), 


哪些 类 型 文 持 这 个 问号 表达 式 呢 ? 标准 库 中 已 经 为 Option、Result 
两 个 类 型 impl1 了 这 个 trait: 


impl<T> ops::Try for Option<T> { 
type Ok = T; 
type Error = NoneError,; 


fn into_result(self) -> Result<T, NoneError> { 


self.ok_or(NoneError) 
} 


fn from ok(v: T) -> Self { 
Some(v) 


fn from error(_: NoneError) -> Self { 


None 
} 
} 
impl<T,E> ops::Try for Result<T, E> { 
type Ok = T; 


type Error = E; 


fn into_result(self) -> Self { 


self 

} 

fn from ok(v: T) -> Self { 
ok(v) 

} 

fn from error(v: E) -> Self { 
Err(v) 

} 


} 


把 这 些 综合 起 来 ， 我 们 就 能 理解 对 于 Result 类 型 ， 执 行 问号 运算 
符 做 了 什么 了 。 其 实 束 是 页 到 Err 的 话 ， 调 用 From trait 做 个 类 型 转换 ， 
然后 中 断 当 前 逻辑 提前 返回 。 


和 Try trait 一 起 设计 的 ， 还 有 一 个 临时 性 的 do catch 语 法 。 在 使 用 
do catch 的 情况 下 ， 问 号 运算 符 丈 不 是 直接 退出 函数 ， 而 是 退出 do 
catch 块 。 示 例如 下 : 


fn file double<P: AsRef<Path>>(file path: P) { 

let r : Result<i32, MyError> = do catch { 
let mut file = File::open(file_ path)?; 
let mut contents = String: :new(); 
file.read_ to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>()?; 
Ok(2 * n) 

}; 

match r { 
Ok(n) => println!("{}", nN), 
Err(err) => printiln!("Error: {:?}", err), 


} 


目前 使 用 这 个 语法 需要 打开 #1! [feature (catch_expr) ] 这 个 feature 
gate。 而 且 语 法 也 是 do catch{} 这 样 的 写法 。 这 么 做 是 为 了 避免 导致 代 
码 不 兼容 的 问题 。 以 前 的 版 本 中 ，catch 这 个 单词 不 是 关键 字 ， 可 能 整 
有 用 户 使 用 了 catch 这 个 名 字 作 为 标识 符 名 字 。 如 采 我 们 直接 把 这 个 单 
词 升级 为 关键 字 ， 必 然 导 致 某 些 现存 代码 编译 错误 。 所 以 引入 关键 字 


这 种 事情 ， 一 定 要 通过 edition 的 版 本 更 友 来 完成 。 在 Rust 2018 edition 

中 ， 所 有 使 用 catch 作 为 标识 符 的 代码 都 会 生成 一 个 警告 ， 但 依然 编译 
通过 。 再 下 一 个 edition 的 时 候 ，catch 就 可 以 提升 为 正式 关键 字 了 ， 到 

那 时 ， 就 不 需要 do catch{} 语 法 ， 而 是 直接 使 用 catch{} 了。 (以 后 也 可 
能 选择 try 作 为 关键 字 ， 目 前 还 没有 定论 。) 


大 家 可 能 又 发 现 ， 如 采 使 用 问号 运算 符 ， 主 要 逻辑 那 部 分 确实 已 
经 简化 得 非常 干净， 但 是 其 他 部 分 的 代码 量 又 有 了 增长 。 我 们 需要 定 
义 新 的 错误 类 型 ， 实 现 一 些 trait， 才 能 让 它 工作 起 来 。 这 部 分 能 不 能 
更 简化 一 点 呢 ? 答案 是 肯定 的 。 


其 中 一 个 方案 是 ， 使 用 trait object 来 蔡 换 enum。 实 际 上 trait object 
和 enum 有 很 大 的 相似 性 ， 它 们 都 可 以 把 一 系列 的 类 型 统一 成 一 个 类 
型 。 恰 好 标准 库 内 部 给 我 们 提供 了 一 个 trait， 来 统一 抽象 所 有 的 错误 


类 型 ， 它 就 是 std: : error: : Error: 


pub trait Error: Debug + Display { 

fn description(&self) -> &str; 

fn cause(&self) -> Option<&dyn Error> { ... } 
} 


所 有 标准 库 里 面 定 义 的 错误 类 型 都 已 经 实现 了 这 个 trait。 所 以 ， 
我 们 可 以 想象 ， 错 误 类 型 其 实 可 以 表示 成 Box<dyn Error>。 下 面 用 这 
种 方式 来 精简 一 下 file_double 这 个 例子 : 


use std::fs::File,; 
use std::io::Read; 
use std::path::Path; 


fn file double<P: AsRef<Path>>(file path: P) -> 
Result<i32, Box<dyn std::error::Error>> { 
let mut file = File::open(file path)?; 
let mut contents = String::new(); 
file.read_ to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>( )?; 
Ok(2 * mn) 
} 


fn main() { 
match file double("foobar") { 
Ok(n) => printjn!("{}", Nn), 
Err(err) => println!("Error: {:?}", err), 


上 面 这 上段 代码 也 可 以 编译 通过 。 因 为 std: : io: : Error 和 std: : 
num: : Parse-Int-Error 类 型 都 实现 了 std: : error: : Error trait， 都 可 
以 转换 为 Box<dyn std: : error: : Error> 这 个 trait object 。 


统一 用 trait object 来 接收 所 有 错误 是 最 简单 的 写法 ， 但 它 也 有 缺 
上 护 。 最 大 的 问题 是 ， 它 不 方便 向 下 转型 。 如 有 果 外 面 的 调用 者 希望 针对 
某 些 类 型 做 特殊 的 错误 处 理 ， 束 很 难 办 。 除 非 你 不 需要 对 任何 错误 类 
型 做 任何 有 区 分 的 处 理 。 这 种 写法 适合 一 些 简单 的 小 工具 。 


使 用 enum 表 达 错 误 类 型 ， 可 以 最 精确 地 表达 错误 人 信息。 当然 带 来 
的 一 个 后 果 是 ， 被 调用 者 的 enum 错 误 类 型 发 生变 化 的 时 候 (比如 给 
enum 增 加 一 个 成 员 ) ， 会 导致 调用 者 那 边 编译 失败 ， 这 是 由 类 型 系统 
保证 的 。 很 多 情况 下 ， 这 其 实 是 设计 者 愿意 看 到 的 结果 ， 改 变 错误 类 
型 本 质 上 就 是 改变 了 API， 此 事 不 该 在 调用 者 完全 不 知情 的 条 件 下 默 
默 进行 。 当 然 ， 有 些 情况 下 设计 者 的 本 意 如 果 束 是 希望 新 增加 一 种 错 
误 类 型 但 不 影响 下 游 用 户 的 兼容 性 。 这 也 是 有 办 法 的 ， 那 就 是 最 开始 
的 版 本 就 给 这 个 enum 类 型 加 上 #[non_exhaustive] 标 签 。 这 样 调用 者 那 
边 的 代码 在 做 模式 匹配 的 时 候 ， 无 论 如 何 都 要 写 一 条 默认 分 文 。 以 后 
给 enum 新 加 一 个 成 员 ， 束 不 会 造成 编译 错误 ， 调 用 者 那 边 的 流程 会 执 
9 °。 具体 要 不 要 使 用 这 个 标签 ， 就 取决 于 设计 
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33.4 main 函数 中 使 用 问号 运算 和 从 


狐 加 入 的 问号 运算 符 给 main 函 数 带 来 了 一 个 挑战 。 因 为 问号 运算 
符 会 return 一 个 Result 类 型 ， 如 果 它 所 处 的 函数 签名 不 是 返回 的 Result 类 
型 ， 一 定 会 出 现 类 型 匹配 错误 。 而 main 函 数 一 开始 的 时 候 是 定义 成 fn 
U -> () 类 型 的 ， 所 以 问号 运算 符 不 能 在 main 函 数 中 使 用 。 这 显然 
息 一 问题， 解决 这 个 问题 的 办 法 就 是 修改 main 函 数 的 签名 类 
型 。 


我 们 希望: main 函 数 既 可 以 返回 unit 类 型 ， 不 人 破坏 以 前 的 旧 代 
码 ; 又 可 以 返回 Result 类 型 ， 文 持 使 用 问号 运算 符 。 所 以 ， 最 简单 的 
tai 兼容 这 两 种 类 型 。Rust 在 标准 库 中 引入 了 一 个 新 
"Jtrait: 


pub trait Termination { 
/// Is called to get the representation of the value as status code. 
/// This status code is returned to the operating system. 
fn report(self) -> i32; 

} 


main 函 数 的 签名 就 对 应 地 改 成 了 fn<T: Termination> () ->T。 标 
准 库 为 Result 类 型 、 () 类 型 、bool 类 型 以 及 发 散 类 型 ! 实现 了 这 个 
trait。 所 以 这 些 类 型 都 可 以 作为 main 函 数 的 返回 类 型 了 。 


它 是 怎么 启动 起 来 的 呢 ? 是 因为 Runtime 库 中 有 这 样 的 一 个 函数 ， 
它 调 用 了 用 户 写 的 main 函 数 : 


#[lang = "start"] 
fn lang_start<T: ::termination::Termination + 'static> 
(main: fn() -> T, argc: isize, argv: *const *const u8) -> isize 


lang_start_internal(&move || main().report(), argc, argv) 


在 最 终 的 可 执行 代码 中 ， 程 序 刚 局 动 的 时 候 要 先 执行 一 些 Runtime 
目 之 的 逻辑 ， 然 后 才 会 进入 用 户 写 的 main 范 数 中 去 。 


33.5 ”新 的 Failure 库 


标准 库 中 现存 的 Error trait 有 几 个 明显 问题 : 
.description 方 法 基本 没什么 用 ; 


无 法 回溯 ， 它 没有 记录 一 层 层 的 错误 传播 的 过 程 ， 不 方便 
debusg; 


.Box<Error> 不 是 线程 安全 的 。 


Failure 这 个 库 束 是 为 了 进一步 优化 错误 处 理 而 设计 的 。 它 主要 包 


人 二 个 立 KA 
舍 三 个 部 分 * 


.新 的 failure: : Fail trait， 是 为 了 取代 std: : error: : Errortrait 而 
设计 的 。 它 包含 了 更 丰富 的 成 员 方 法 ， 且 继承 于 Send+Sync， 具 备 线 
程 安全 特性 。 


目 动 derive 机 制 ， 主 要 有 是 让 编译 顺 帮 用 户 写 一 些 重复 性 的 代码 。 


:failure: : Error 结 构 体 。 所 有 其 他 实现 了 Fail trait 的 销 误 类 型 ， 都 
可 以 转换 成 这 个 类 型 ， 而 且 它 提供 了 问 下 转型 的 方法 。 


使 用 failure 来 实现 前 面 那个 示例 ， 代 码 如 下 : 


#[macro_usel] 
extern crate failure; 


use std::fs::File,; 
use std::io::Read; 
use std::path::Path; 


#[derive(Debug, Fail)] 
enum MyError { 


#[fail(display = "IO error {}.", _0)] 
Io(#[cause] std::io::Error), 
#[fail(display = "Parse error {}.", _0)] 


Parse(#[cause] std::num::ParseIntError), 


} 


impl From<std::io::Error> for MyError { 
fn from(error: std::io::Error) -> Self { 
MyError::Io(error) 


} 


impl From<std: :num: :ParseIntError> for MyError { 
fn from(error: std::num::ParseIntError) -> Self { 
MyError::Parse(error) 
} 


} 


fn file_double<P: AsRef<Path>>(file path: P) -> Result<i32, MyError> { 
let mut file = File::open(file path)?; 
let mut contents = String::new(); 
file.read_ to_string(&mut contents)?; 
let n = contents.trim().parse::<i32>()?;,; 
Ok(2 * mn) 


fn main() { 
match file double("foobar") { 
Ok(n) => printjn!("{}", Nn), 
Err(err) => println!("Error: {:?}", err), 


现在 社区 里 已 经 有 一 些 库 转 向 使 用 failure 做 错误 处 理 。 它 将 来 可 
能 是 Rust 生 态 系统 中 主流 的 错误 处 理 方式 。 
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Rust 有 一 个 非常 好 的 特性 ， 就 是 它 文 持 与 C 语 言 的 ABI 兼 容 。 什 么 
是 ABI 呢 ?维基 百科 是 这 么 解释 的 : 


In computer software, an application binary interface (ABI) isan 
interface between two program modules; often, one of these modules isa 
library or operating System facility, and the other is a program that is being 
run by a user. 


An ABI defines how data structures or computational routines are 
accessed in machine code, which isa low-level, hardware-dependent 
format. 


一 一 Wikipedia 


所 以 ， 我 们 可 以 用 Rust 写 一 个 库 ， 然 后 直接 把 它 当 成 C 写 的 库 来 使 
用 。 或 者 反 过 来 ， 用 C 写 的 库 ， 可 以 直接 在 Rust 中 被 调用 。 而 且 这 个 过 
程 是 没有 额外 性 能 损失 的 。C 语 言 的 ABI 是 这 个 世界 上 最 通用 的 ABI,， 
大 部 分 编程 语言 都 支持 与 C 的 ABI 兼 容 。 这 也 意味 着 ，Rust 与 其 他 语言 
之 则 的 交互 古 没 问题 的 ， 比 如 用 Rust 为 Python/Node.js/Ruby 写 一 个 模块 


于 


本 草 主 要 讲解 Rust 如 何 与 其 他 语言 进行 交互 ， 为 了 让 示例 尽 可 能 
地 人 簿 洁 、 清 上 晰 ， 本 章 主要 关注 的 是 Rust 如 何 与 C 语 言 进行 诡 互 。 至 于 其 
他 语言 ， 搞 清楚 它们 如 何 与 C 语 言 交 互 训 完全 可 以 掌握 它们 与 Rust 的 交 
互 办 法 ， 所 以 无 须 一 个 个 地 分 别 讲解 。 


34.1 什么 是 FFI 


所 谓 的 FFI 指 的 是 : 


A foreign function interface (FFI) is a mechanism by which a 
program written in one programming language can call routines or make 
Use of services written in another. 


Wikipedia 


Rnust 不 文 持 源码 级 别 与 其 他 语言 的 交互 ， 因 为 这 人 么 做 代价 很 大 、 
限制 太 多 ， 所 以 需要 用 库 的 方式 来 互相 调用 。 这 就 要 求 我 们 有 能 力 用 
Rust 生 成 与 C 的 ABI 兼 容 的 库 。 通 过 rustc-h 命 令 我 们 可 以 看 到 ，Rust 编 
译 器 支持 生成 这 样 一 些 种 类 的 库 : 


--crate-type [bin|lib|rlib|ldylib|cdylib|staticlib|proc-macro] 
Comma separated list of types of crates for the 
compiler to emit 


其 中 ，cdylib 和 staticlib 就 是 与 C 的 ABI 兼 容 的 。 分 别 代表 动态 链接 
库 和 静态 链接 库 。 在 编译 的 时 候 ， 我 们 需要 指定 这 样 的 选项 才能 生成 
合适 的 目标 文件 。 指 定 目 标 文 件 类 型 有 两 种 方式 : 


:在 编译 命令 行 中 指定 ， 如 rustc--crate-type=staticlib test.rs; 


:在 源 代 码 入 口中 指定 ， 如 #1! [crate_type="staticlib"]。 


另外 ， 我 们 还 需要 注意 ，C 的 ABI 以 及 运行 时 库 也 不 是 完全 统一 
的 。 此 事 是 由 rustup 工 具 管理 的 。 执 行 rustup show 可 以 看 到 当前 使 用 的 
工具 链 是 什么 ， 比 如 笔者 当前 的 工具 链 是 : 


Default host: x86_64-unknown-linux-gnu 


这 意味 着 用 这 套 工具 链 生 成 的 C 库 是 和 gcc 工 具 链 的 ABI 兼 容 的 。 
如 果 读 者 需要 生成 与 MSVC 的 ABI 兼 容 的 库 ， 那 么 需要 使 用 : 


rustup target add x86 64-pc-windows-msvc 


我 们 还 可 以 用 rustup 来 下 载 Android 系 统 的 工具 链 ， 实 现 交叉 编 
译 ， 等 等 。 关 于 工具 链 以 及 C 运 行 时 库 的 链接 方式 的 问题 ， 读 者 可 以 
参考 rustup 的 官方 网 站 。 


除了 指定 目标 文件 、 工 具 链 之 外 ， 更 重要 的 是 需要 注意 接口 的 设 
计 。 不 是 所 有 的 Rust 的 语言 特性 都 适合 放 到 交互 接口 中 的 。 比 如 ， 
Rust 中 有 泛 型 ，C 语 言 里 面 没 有 ， 所 以 泛 型 这 种 东西 是 不 可 能 暴露 出 来 
给 C 语 言 使 用 的 ， 这 就 不 是 C 语 言 的 ABI 的 一 部 分 。 只 有 符合 C 语 言 的 
调用 方式 的 函数 ， 才 能 作为 FFI 的 接口 。 这 样 的 函数 有 以 下 基本 要 求 : 
:使 用 extern"C" 修 饰 ， 在 Rust 中 extern fn 默认 等 同 于 extern"C"fn: 
-使 用 #[no_mangle] 修 饰 函 数 ， 避 人 免 名 字 重 整 ，; 


图 数 参数 、 返 回 值 中 使 用 的 类 型 ， 必 须 在 Rust 和 C 里 面具 备 同样 
的 内 存 布局 。 


下 面 我 们 用 示例 来 说 明 如 何 实现 FFI。 


34.2 ”从 C 调 用 Rust 库 


假设 我 们 要 在 Rust 中 实现 一 个 把 字符 串 从 小 写 变 大 写 的 函数 ， 然 
后 由 C 语 言 调 用 这 个 函数 。 实 现代 码 如 下 : 


#[no_mangle] 
pub extern "C" fn rust_capitalize(s: *mut c_char) 


unsafe 区 
let mut p= s as *mut u8; 
while *p != © { 
let ch = char::from(*p); 
if ch.is ascii() { 
let upper = ch.,to ascii uppercase(); 
*p = upper as u8,; 
} 
p 
} 


= p.offset(1); 


} 
} 


我 们 在 Rust 中 实现 这 个 函数 ， 考 虚 到 C 语 言 调用 的 时 候 传 递 的 是 
char* 类 型 ， 所 以 在 Rust 中 我 们 对 应 的 参数 类 型 是 *mut std: : os: : 
raw: : Cc_char。 这 样 两 边 就 对 应 起 来 了 。 


这 个 函数 是 要 被 外 部 的 C 代 码 调 用 的 ， 所 以 一 定 要 用 extern"C" 修 
饰 。 用 #[no_mangle] 修 饰 主要 是 为 了 保证 导出 的 芳 数 名 字 和 源码 中 的 
一 致 。 这 个 并 不 是 必须 的 ， 我 们 还 可 以 使 用 # 
[export_name="my_whatever_name"] 来 指定 导出 名 字 。 在 某 些 时 候 ， 我 
们 需要 导出 的 函数 名 恰好 在 Rust 中 跟 某 个 关键 字 发 生 了 神 突 ， 束 可 以 
用 这 种 方式 来 规避 。 


使 用 如 下 编译 命 仿 ， 可 以 生成 一 个 与 C 的 ABI 兼 容 的 静态 库 。 


rustc --crate-type=staticlib capitalize.rs 


下 面 我 们 再 写 一 个 调用 这 个 函数 的 C 程 序 : 


#include <stdlib.h> 
#include <stdio.h> 


// declare 
extern void rust_ capitalize(char *); 


int main() { 
char str[] = "hello world"; 
rust_capitalize(str); 
printf("%s\n", str); 
return ©; 


使 用 如 下 命令 编译 链接 : 


gcc -0o main main.c -L. -1:libcapitalize.a -Wl,--gc-sections -lpthread -ldl 


WA 
功能。 


34.3 ”从 Rust 调 用 C 库 
这 个 例子 我 们 反 过 来 ， 从 Rust 中 调用 C 写 的 库 。C 的 实现 如 下 所 


int add_square(int a, int b) 


return a*a+b™* pb， 


使 用 如 下 命令 可 以 生成 对 应 的 静态 库 : 


gcc -c -Wall -werror -fpic simple math.c 
ar rcs libsimple math.a simple math.o 


现在 我 们 到 Rust 中 调用 这 个 静态 库 : 


use std::os::raw::c_int， 


#[link(name = "Simple_math")] 
extern "CcC" { 

fn add_square(a: c_int, b: c_int) -> c_int; 
} 


fn main() { 
let r = unsafe { add square(2，2) }; 
println!("{}", r); 

} 


使 用 如 下 命令 编译 链接 : 


rustc -L . call _ math.rs 


参数 工 可 以 指定 依赖 库 的 查找 路 径 ， 具 体 的 名 字 可 以 通 


(name="library_name") ] 来 指定 。 


过 #[link 


34.4 ”更 复 洒 的 数据 类 型 


对 于 交互 接口 中 的 简单 类 型 ， 我 们 直接 使 用 标准 库 中 定义 好 的 
std: : 0S: : raw 里 面 的 类 型 束 够 了 。 而 更 复杂 的 类 型 就 需要 我 们 手 
动 封装 了 。 比 如 结构 体 就 需要 用 #[repr (C) ] 修 饰 ， 以 保证 这 个 结构 体 
在 Rust 和 C 双 方 的 内 存 布局 是 一 致 的 。 


如 果 我 们 需要 做 的 是 跟 常 见 的 操作 系统 交互 ， 许 多 常用 的 数据 结 
构 都 已 经 有 人 封装 好 了 ， 可 以 在 crates.io 找 libc 库 0 接 下 来 我 
们 用 一 个 示例 演示 一 下 在 接口 中 包含 结构 体 该 怎样 做 。 这 个 示例 同时 
也 使 用 了 cargo 来 管理 Rust 项 目 ， 且 使 用 动态 链接 库 的 方式 执行 。 


Rnust 项 目 Cargo.toml 如 下 所 示 : 


[package] 

name = "log" 
version = "0.1.0" 
authors = ["F001"] 


[dependencies] 
libc = "0.2" 
[1ib] 

name = "rust_log" 


crate-type = ["cdylib"] 


src/lib.rs 文 件 内 容 如 下 所 示 : 


#![crate type = "cdylib"] 
extern crate libc; 


use libc::{c_int, c_char}; 
use std::ffi::CStr,; 


// this struct is used as an public interface 
#[repr(C)] 
#[no_mangle] 
pub struct RustLogMessage { 
id: c_int, 
msg: *const c_char 


} 


#[no_mangle] 
pub extern "C" fn rust_log(msg: RustLogMessage) { 


let s = unsafe { CStr::from ptr(msg.msg) }; 
println!("id:{} message:{:?}", msg.id, s); 


使 用 cargo build 就 可 以 编译 出 对 应 的 动态 库 。 
C 语 言 的 调用 代码 如 下 所 示 : 


#include <stdio.h> 
#include <stdlib.h> 
#include <dlfcn.h> 
struct RustLogMessage { 
int id; 
char *msg; 


int main() 
void *rust_log_1l1ib,; 
void (*rust_ log fn)(struct RustLogMessage msg); 


rust_log_lib = dlopen("./rust_log/target/debug/librust_1log.so", RTLD_LAZY); 
If ( rust log lib != NULL ) { 
rust_log_fn = dlsym(rust_log_l1ib, "rust_ log"); 
} else { 
printf("load so library failed.\n"); 
return 1; 


} 


for (int i = 0; i < 10; i++) { 
struct RustLogMessage msg = { 
Id : 3, 
msg : "string in C\n", 


}; 
rust_log_fn(msg); 
} 


If (rust_ log lib != NULL ) dlclose(rust_ log_ 1ib); 


return EXIT_SUCCESS, 


编 详 命令 为 gcc main.c-ldl。 执 行程 序 之 前 ， 要 保证 动态 链接 库 和 
可 执行 程序 之 间 的 相对 路 径 关 系 是 正确 的 ， 然 后 执行 。 可 见 ， 参 数 正 
确 地 在 Rust 和 C 之 间 传 递 了 。 


第 35 草 ”文档 和 测试 
35.1 文档 


Rnust 也 文 持 使 用 注释 来 编写 规范 的 文档 。 可 以 使 用 rustdoc 工 具 把 
源码 中 的 文档 提取 出 来 ， 生 成 易 读 的 HIML 等 格式 。 在 cargo 里 面 可 以 
用 cargo doc 命 令 生成 文档 。 


普通 的 注释 有 两 种 ， 一 种 是 用 /开头 的 ， 是 行 注释 ， 一 种 是 /#*/， 
是 块 注释 。 这 些 注释 不 会 被 视 为 文档 的 一 部 分 。 特 殊 的 文档 注释 
是 /NW 、/x*. .ki#1 ...*/， 它 们 会 被 视 为 文档 。 

跟 attribute 的 规则 类 似 : 用 开头 的 文档 被 视 为 是 给 它 后 面 的 那个 


元 聂 做 的 说 明 ; /1 开头 的 文档 被 视 为 是 给 包含 这 块 文档 的 元 聚 做 的 
说 明 。/A#*#.…*/ 和 /#*!1 ...*/ 也 是 类 似 的 。 示 例如 下 : 


mod foo { 
//! 这 块 文档 是 给 “foo” 模 块 做 的 说 明 
/// 这 块 文档 是 给 函数 “ff” 做 的 说 明 
fn f() { 
// 这 块 注释 不 是 文档 的 一 部 分 


文档 内 部 支持 markdown 格 式 。 可 以 使 用 # 作 为 一 级 标题 。 比 如 标 
准 库 中 常用 的 儿 种 标题 : 


/// # Panics 
/// # Errors 
/// # Safety 
/// # Examples 


文档 中 的 代码 部 分 要 用 符号 把 它们 括 起 来 。 代 码 块 应 该 用 括 
起 来 。 比 如 : 


/// ~ 
/// let mut vec = Vec::with capacity(10); 


/// 

/// // The vector contains no items, even though it has capacity for more 
/// assert_eq!(vec.len(), 0); 

/// ~ 


Rust 文 档 里 面 的 代码 块 ， 在 使 用 cargo test 命 令 时 ， 也 是 会 被 当做 
例 执行 的 。 这 个 设计 可 以 在 很 多 时 候 检 查 出 文档 和 代码 不 对 应 
9 情况 。 


如 果 文 档 太 长 ， 也 可 以 写 在 单独 的 markdown 文 件 中 。 如 果 在 单独 
的 文件 中 写 文 档 ， 就 不 需要 再 用 /// 或 者 //! 开头 了 ， 直 接 写 内 容 就 可 
以 。 然 后 再 用 一 个 attribute 来 指定 给 对 应 的 元 素 : 


#![feature(external_doc)] 


#[doc(include = "external-doc.md")] 
pub struct MyAwesomeType; 


35.2 ”测试 


Rust 内 置 了 一 套 单元 测试 框 染 。 单 元 测试 是 一 种 目前 业界 广泛 使 
用 的 ， 可 以 显著 提升 代码 可 靠 性 的 工程 管理 手段 。 Rust 里 面 的 单元 测 
斌 代码 可 以 直接 和 业务 代码 写 在 一 个 文件 中 ， 非 常 有 利于 管理 ， 方 便 
更 新 。 执 行 单元 测试 也 非常 简单 ， 一 条 cargo test 命 令 即 可 。 


一 般 情 况 下 ， 如 果 我 们 新 建 一 个 library 项 目 ，cargo 工 具 会 帮 有 我 们 
在 Srclib.rs 中 目 动 生成 如 下 代码 : 


#[cfg(test)] 

mod tests { 
#[test] 
fn it works() { 
} 


本 。 下面 详细 介绍 一 下 这 里 面 的 各 个 


首先 ，Rust 里 面 有 一 个 特殊 的 attribute， 叫 作 基 cfgl]。 它 主要 是 用 
于 实现 各 种 条 件 编译 。 比 如 #[cfg (test) ] 意 思 是 ， 这 部 分 代码 只 在 test 
这 个 开关 打开 的 时 候 才 会 被 编译 。 它 还 有 更 高 级 的 用 法 ， 比 如 


#[cfg(any(unix, windows))] 
#[cfg(all(unix, target_pointer_width = "32"))] 


#[cfg(not(foo))] 
#[cfg(any(not(unix), all(target os="macos", target arch = "powerpc")))] 


i 目 定 义 一 些 功能 开关 。 比 如 在 Cargo.toml 中 加 入 这 样 的 


[features] 
# 默认 开启 的 功能 开关 
default = [] 


# 定义 一 个 新 的 功能 开关 , 以 及 它 所 依赖 的 其 他 功能 


# 我 们 定义 的 这 个 功能 不 依赖 其 他 功能 , 默认 没有 
my_feature_name = [] 


下 


之 后 整 可 以 在 代码 中 使 用 这 个 功能 开关， 某 部 分 代码 可 以 根据 这 
个 开关 的 状态 决定 编译 还 是 不 编译 : 


#[cfg(feature = "my_feature_name")] 
mod sub_module_ name { 
} 


这 个 开关 究竟 是 开 还 是 天 ， 可 以 通过 编译 选项 传递 进去 : 
cargo build --features "my_feature_ name" 


当 我 们 使 用 cargo test 命 令 的 时 候 ， 被 #[cfg (test) ] 标 记 的 代码 整 
会 被 编译 执行 ;否则 直接 被 忽略 。 


我 们 还 是 用 一 个 示例 来 说 明 。 我 们 现在 准备 实现 一 个 轰 转 相 除 法 
求 最 大 公约 数 的 功能 。 痢 建 一 个 名 叫 gcd 的 项 目 : 


cargo new --lib gcd 


轧 园 相 除 法 的 细 市 束 不 展开 了 。 实 现代 码 如 下 所 示 : 


pub fn gcd(a: u64, b: u64) -> U64 
{ 


let (mut 1, mut g) = if a< bf 
(a, b) 


接 下 来 添加 一 个 最 基本 的 测试 : 


#[cfg(test)] 
mod tests { 
#[test] 
fn it works() { 
assert_eq!(gcd(2, 3), 1); 
} 


} 


使 用 cargo test 命 令 执行 这 个 测试 。 这 一 次 发 生 了 编译 错误 ， 编 译 
名 找 不 到 gcd 这 个 函数 。 这 是 因为 我 们 把 测试 用 例 写 在 了 一 个 单独 的 模 
块 中 ， 在 子 模块 中 并 不 能 直接 访问 父 模块 中 的 内 容 。 在 mod 内 部 加 一 
名 use gcd; 或 者 use super: : *; 可 以 解决 这 个 问题 。 


Compiling gcd v0.1.0 (file:///projects/gcd) 
Finished dev [unoptimized + debuginfo] target(s) in 2.33 secs 
Running target/debug/deps/gcd-1658b34bide16a01 


running 1 test 
test tests::it works ... ok 


test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out 
Doc-tests gcd 
running © tests 


test result: ok. © passed; 0 failed; 0 ignored; 0 measured; 0 filtered out 


打印 出 来 的 结果 非常 清晰 易 读 。 前 面 一 部 分 是 执行 测试 模块 中 的 
测试 用 例 的 结果 ， 后 面 一 部 分 是 执行 文档 中 的 测试 用 例 的 结果 。1 
passed 代 表 通 过 了 1 个 测试 。0 failed 代 表 失 败 了 0 个 测试 。0 ignored 代 表 
忽略 了 0 个 测试 。 


用 户 可 以 用 大 ignore] 标 记 测 斌 用例， 暂时 忽略 这 个 测试 。 比 如 : 


#[test] 

#[ignore] 

fn it works() { 
assert_eq!(gcd(2, 3), 1); 

} 


0 measured 代 表 跑 了 0 个 benchmark 性 能 测试 。 我 们 可 以 用 #[bench|] 
添加 性 能 测试 用 例 : 


#[cfg(test)] 
mod tests { 
USe super::*,; 
use self::test::Bencher; 


#[bench] 
fn big_num(b: &mut Bencher) { 
b.iter(|| gcd(12345, 67890) ) 


这 个 功能 日 前 还 没有 稳定 ， 需 要 用 户 在 当前 crate 中 开启 feature 
gate: 


#![feature(test)] 
extern crate test; 


然后 使 用 cargo bench 束 可 以 执行 这 个 性 能 测试 。 这 时 就 可 以 看 到 
测试 结果 中 有 1 measured 的 结果 。 


测试 结果 中 还 有 0 filtered out 统 计数 据 。 这 个 数据 代表 的 是 用 户 跑 
测试 的 时 候 过 滤 出 来 了 多 少 测 斌 用例。 比如 我 们 有 许多 测试 用 例 ， 但 
是 只 想 执 行 某 一 个 具体 的 测试 用 例 it_works， 可 以 这 样 做 : cargo test 
it_works。 或 者 可 以 用 开头 几 个 字母 过 滤 出 多 个 测试 用 例 ， 比 如 cargo 
test it。 还 有 更 多 的 用 法 可 以 参见 cargo test-h。 


在 测试 用 例 内 部 ， 我 们 一 般 用 assert_eq! 宏 来 检查 真实 结果 和 预 
期 结果 是 否 一 致 。 除 此 之 外 ， 也 还 有 其 他 的 检查 方法 。assert! 宏 可 以 
用 于 检查 一 个 bool 类 型 结果 是 否 为 tue。assert_ne! 安 可 以 用 于 检查 两 
个 数据 是 否 不 相等 。 另 外 ， 我 们 还 可 以 在 这 些 宏 里 面目 定义 错误 信 
息 。 比 如 我 们 用 0 来 测试 上 面 这 个 gcd 函 数 。 因 为 0 作为 除数 没有 意义 ， 
所 以 我 们 希望 任何 一 个 参数 为 0 的 时 候 ， 输 出 结果 都 是 0， 可 以 写 这 样 
的 测试 用 例 : 


#[test] 
fn with_zero() { 
assert_eq!(gcd(10, 0), 0, "division by zero has no meaning"); 


} 


如 果 测 斌 失败， 失败 消 息 中 会 显示 我 们 指定 的 那 条 信息 。 


另外 ， 有 些 时 候 测 试 结果 无 法 用 “等 于 不 等 于 ”这 种 条 件 表 达 ， 比 
如 发 生 panic。 测 试 框架 也 允许 我 们 用 #[should_panic] 做 这 种 测试 。 假 
设 ， 我 们 修改 一 下 上 面 的 gcd 芳 数 的 逻辑 ， 不 允许 参数 为 0， 如 果 参 数 
是 0 直接 发 生 panic: 


pub fn gcd(a: u64, b: u64) -> U64 
{ 


if a ==0 || b==0 
panic!("Parameter should not be zero"); 


为 了 测试 这 种 情况 ， 我 们 可 以 写 如 下 测试 用 例 : 


#[test] 

#[should_panic] 

fn with_zero() { 
gcd(10, 0); 


一 般 我 们 都 把 测 斌 用例 放 到 单独 的 mod 里 面 ,， 打上 #[cfg (test) ] 
条 件 编译 的 标签 ， 这 样 编 译 正常 代码 的 时 候 就 可 以 把 测试 相关 的 整个 
模块 忽略 挥 。 这 个 测试 模块 一 般 责 接 放 在 被 测试 代码 的 同一 售 文 件 
中 : 一 方面 是 比较 直观 容易 管理 ， 另 一 方面 ， 根 据 Rust 的 模块 可 见 性 
规则 ， 这 个 测试 模块 有 权 访 问 它 父 模块 的 私有 元 素 ， 这 样 比较 方便 测 


试 。 


用 户 也 可 以 目 己 组 织 测试 用 例 的 代码 结构 。 比 如 单独 使 用 一 个 新 
的 文件 夹 来 管理 测试 用 例 ， 这 都 是 没 问 题 的 。 毕 苋 测 试 代码 也 不 过 就 
征 一 个 普通 的 模块 而 已 ， 我 们 可 以 目 由 选择 如 何 管理 这 个 模块 。 


Rust 默 认 的 测试 框架 毕竟 还 只 是 一 个 轻 量 级 的 框架 。 功 能 比 许多 
其 他 语言 中 的 大 型 测试 框架 要 差 一 些 。 这 也 是 目前 Rust 设 计 组 比较 关 
心 的 一 个 领域 。 他 们 正在 设计 一 个 方案 ， 使 用 户 可 以 比较 方便 地 实现 
自 定义 测试 框架 。 这 样 可 以 由 社区 开发 一 些 功 能 更 强大 的 测试 框架 作 
为 替代 品 ， 供 大 家 使 用 。 


ABI 

Alias 

Arc 

Associated Item 
Atomic 
Attribute 
Borrow Check 
Box 

Cargo 

Closure 
Compile Unit 
Constructor 
Copy 

Crate 

Data Race 
Deref 
Destructor 
Destructure 
diverge function 
DST 


Dynamic Trait Type 


Fat Pointer 
Feature Gate 
FFI 


附 好 ”词汇 表 


Application Binary Interface 
别名 


Atomic Reference Counter 


关联 条 目 ， 包括 关联 类 型 、 关 联 方 法 、 关 联 常 量 等 


原子 的 


属性 ， 在 Rust 中 跟 宏 性 质 是 一 样 的 东西 ， 


借用 检查 

具有 所 有 权 的 智能 指针 
Rust 的 官方 包 管理 工具 
闭 包 

编译 单元 

构造 器 


特殊 trait， 代 表 类 型 默认 是 复制 语义 


Rust 的 基本 编译 单元 

解 引 用 

析 构 函数 

解构 

发 散 函 数 ， 永 远 不 会 返回 的 函数 


语法 外 观 不 同 


Dynamic Sized Type 编译 阶段 无 法 确定 大 小 的 类 型 


Trait Object 的 新 名 字 
胖 指 针 ， 即 还 携带 额外 信息 的 指针 
功能 开关 


Foreign Function Interface 


Fn/FnMut/FnOnce 


Generic 


Higher Rank Lifetime 
Higher Rank Trait Bounds 
Higher Rank Type 


ICE 


inherited mutability 
Interior Mutability 


intrinsics 
lterator 
Lifetime 
Lifetime Elision 
Lint 

LLVM 

Macro 
Memory Safe 
MIR 

Module 
Move 
Mutability 
NLL 

Object Safe 
OIBIT 
Orphan Rules 
Ownership 
Panic 

Pattern Match 


Placement New 
Playpen 


POD 

Prelude 

Race Condition 
RAT 

Re 

Release Channel 
RFC 

Rustc 

RVO 


( 续 ) 
闭 包 相关 的 系列 trait 
泛 型 
高 阶 生命 周期 
高 阶 trait 约束 
高 阶 类 型 系统 
Intemal Compiler Error 编译 器 内 部 错误 
承袭 可 变性 
内 部 可 变性 
编译 器 内 置 函 数 
友 代 器 
生命 周期 
生命 周期 省 略 
可 自 定义 扩展 的 编译 阶段 检查 
Low Level Virtual Machine 
宏 
内 存 安全 ，Rust 的 内 存 安全 主要 指 没 有 段 错 误 Segmentation fault 
Middle-level IR 
模块 
移动 
可 变性 
Non Lexical Lifetime， 非 词法 生命 周期 
能 正确 构造 trait object 的 规则 
opt-in builtin traits ， 新 名 字 为 Auto trait 


孤儿 规则 

所 有 权 

恶 慌 ， 在 Rust 中 用 于 不 可 恢复 错误 处 理 
模式 匹配 


在 用 户 指定 的 内 存 位 置 上 构建 新 的 对 象 

指 的 是 http://play.rust-lang.org 网 站 。 这 个 网 站 提供 了 方便 的 编写 、 编 译 、 
执行 Rust 代码 的 能 力 

Plain Old Data 

预先 声明 的 自动 被 包含 到 每 个 源码 中 的 内 容 

况 态 条 件 

Resource Acquisition Is Initialization 是 C++ 等 编程 语言 常用 的 管理 资源 方法 

Reference Counted 引用 计数 智能 指针 

发 布 渠道 

Request For Comments 语言 设计 提案 ，FCP 指 Final Comment Period 

Rnust 官方 编译 器 的 可 执行 文件 名 字 


Return Value Optimization 


Self/self 

Send 
Shadowing 
SIMD 

Sized 

Slice 
Specialization 
Stack Unwind 
SITE 

Sync 

TLS 

Toml 

Trait Object 
TWiR 


Type Inference 
UFCS 


Unit Type 
Unsized Type 
VTable 

ZST 


( 续 ) 
小 写 s 是 特殊 变量 ， 大 写 S 是 特殊 类 型 
特殊 的 trait， 代 表 变 量 可 以 跨 线程 转移 所 有 权 
遮蔽 ,变量 允许 遮蔽 ， 类 型 和 生命 周期 不 允许 
Single Instruction Multiple Data 单 指令 多 数据 流 
特殊 的 trait， 代 表 编 译 阶段 类 型 的 大 小 是 已 知 的 
数组 切片 
泛 型 特 化 
栈 展开 
standard template library 是 C++ 的 标准 模板 库 
特殊 trait， 代 表 变 量 可 以 跨 线 程 共享 
Thread Local Storage 线程 局 部 存储 
一 种 文本 文件 格式 
指向 对 象 及 其 虚 表 的 胖 指针 ， 以 后 会 改名 为 dynamic trait type 
This Week in Rust， 一 个 很 有 信息 量 的 网 站 
类 型 自动 推导 
Universal Function Call Syntax, 通用 函数 调用 语法 ， 
后 来 改 为 Fully Qualified Syntax 
单元 类 型 ， 即 空 ttple， 记 为 () 
不 满足 Sized 约束 的 类 型 
虚 函 数 表 
零 大 小 数据 类 型 


